جوجل تطور نموذج ذكاء اصطناعى جديدا لإنتاج مقاطع صوتية وحوارات للفيديو
يعمل Google DeepMind على نموذج جديد للذكاء الاصطناعي يمكنه إنشاء مقاطع صوتية وحوارات لمقاطع الفيديو، في منشور مدونة حديث، كشف مختبر أبحاث الذكاء الاصطناعي التابع لشركة جوجل العملاقة عن V2A (فيديو إلى صوت)، وهو نموذج جديد قيد التنفيذ للذكاء الاصطناعي “يجمع بين وحدات بكسل الفيديو مع نص اللغة الطبيعية الذي يطالب بإنشاء مقاطع صوتية غنية للشاشة التي تظهر عليها “فعل”.
يُحدث إنشاء مقاطع فيديو من المطالبات النصية ضجة كبيرة في عالم الإبداع، إلا أن غالبية الأدوات المتاحة لها عيب كبير وتقتصر على مقاطع الفيديو الصامتة.
تم تصميم V2A من Google DeepMind للعمل بسلاسة مع Veo، وهو نموذج Google لتحويل النص إلى فيديو والذي تم تقديمه في I/O 2024 الشهر الماضي.
يتيح هذا المزيج للمستخدمين تحسين مقاطع الفيديو الخاصة بهم ليس فقط بصريًا ولكن أيضًا مسموعًا، كما يمكن لـ V2A أيضًا بث الحياة في “اللقطات التقليدية” مثل الأفلام الصامتة والمواد الأرشيفية، حسبما ذكرت صحيفة Indian Express.
تهدف تقنية نموذج الذكاء الاصطناعي هذه إلى تغيير الطريقة التي ينشئ بها المستخدمون مقاطع الفيديو التي ينشئها الذكاء الاصطناعي ويجربونها، كذلك يمكن استخدامه لإضافة مؤثرات صوتية واقعية وموسيقى درامية وحوار يتناسب مع نغمة الفيديو.