سيدة البلوتوث تتحدث! “الجهات الفاعلة الصوتية سيكونون حرفيين في عصر الذكاء الاصطناعي”
الآن ، اللعبة هي جميع الكتب المسموعة ، طوال الوقت ، لسيدة Bluetooth ، وإلى حد ما ، منصات رئيسية مثل Spotify ، والتي تقوم بتجربة مستويات التسعير والحزم لهذه التنسيقات ، وقد أطلقت للتو برنامج نشر جديد للمؤلفين المسموحين المستقلين.
“يجب عليك القيام ببعض التحركات السريعة” ، كما تقول. “لقد بدأت في اختبار المزيد في المساحة التجارية والقفز إلى الكتب الصوتية ، بدوام كامل تقريبًا الآن.” على الرغم من حقيقة أن الشركات الناشئة مثل Pleintki تقدم أصواتًا اصطناعية لهذه الحالة الدقيقة ، إلا أن DimerCurio واثق إلى حد ما من أن الذكاء الاصطناعى لن يتولى صوتية صوتية أو صوت بودكاست مكتوبة في أي وقت قريب. “نحن في مكان حيث ، عندما يكون لديك مطرقة ، يبدو كل شيء وكأنه مسمار. لديك هذه الأداة الكبيرة والثقيلة-AAI-ونحن نحطم كل ما يمكن أن نراه به. لقد تمسك في ساحات معينة من الصوت ، تلك التي لا تحتاج إلى الشعور بالشخصية للغاية. ولكن جزءًا من السبب في أن خيال البودكاست أصبح شيئًا ما هو سماع صوت الشخص في أذنك.”
كممثل ، يهتم DimerCurio بالعديد من المشاعر و “الملاحظات الصغيرة” التي يمكنك التقاطها فقط بالطريقة التي يقول بها شخص ما. يثق بعض الجهات الفاعلة في أمعائهم ، أو يقومون بانتحال شخصية ، وينظر آخرون إلى صوت الحبيبي ، ومراقبة ، وإعادة إنشاء ، ومعالجة سرعة الكلام ، والانعكاس والموضع ، للعمل كمجموعة من “الرافعات” ، على سبيل المثال ، لإنتاج شخصيات مسموعة مختلفة.
عندما يتعلق الأمر بالصوت بشكل عام ، فإنها تعتقد أن الذكاء الاصطناعى أصبح الآن مقبولًا وأننا قد نصل إلى النقطة التي يكون فيها الأمر دقيقًا مثل التحدث إلى شخص ما ، لكن “لا أعتقد أن الأمر سيضرب نفسه تمامًا”.
على المدى القصير ، تتوقع تسطيحًا في الصوت الإعلاني ، على غرار التجانس المفاجئ في التصميم الجرافيكي قبل بضع سنوات عندما بدا أن جميع العلامات التجارية بدأت تبدو كما هي. وتقول: “كل صوت تقريبًا تسمعه ، هناك شخص ما وراء ذلك ،” حتى أن منظمة العفو الدولية كانت شخصًا سجل ذلك عند نقطة واحدة. ” لكن أصوات الذكاء الاصطناعى مصممة لتكون مستساغة لأوسع جمهور ممكن ، “لذلك نحن نفقد الخصوصية ، والهوية ، والمراوغات الصغيرة – مثل أحد قصافرة مثلما تفعل. أنت لا تفكر في الأمر ، حتى أنك لا تسمعها ، لأنها محايدة للغاية. “
في النهاية يتنبأ Dimercurio بأن الجهات الفاعلة الصوتية ستصبح صقلًا راقيًا في بعض الصناعات. وتقول: “سوف يصبح الصوت البشري مفصلًا”. “سنصبح عنصرًا فاخرًا ، ونفكر في الأمر تقريبًا مثل الحرفيات. لذلك إذا كنت علامة تجارية فاخرة ، فستكون لديك صوت شخص حقيقي بدلاً من الذكاء الاصطناعي في إعلاناتك التجارية وفي منتجاتك. بنفس الطريقة التي يمكنك بها الحصول على السيراميك والأوعية المصنوعة يدويًا أو يمكنك شرائها من Wal-Mart.”
جاءت دراسة حالة سيئة السمعة الآن توضح قوة صوت بشري واحد مميز في مايو الماضي عندما اضطر Openai إلى إيقاف استخدام صوت السماء لـ GPT-4O ، وهو واحد من خمسة أصوات أولية لـ Chatbot. جاء هذا بعد سكارليت جوهانسون – نعم ، ها-مستشار قانوني مستدير ، مدعيا أن Openai قامت بتقليدها بعد أن رفضت طلبًا من الرئيس التنفيذي ، Sam Altman ، لترخيص صوتها للمنتج وبعد أن قام Altman بتغريد هذه التغريدة ذات الكلمات الفردية: ها.