تعمل Apple على تطوير أداة ذكاء اصطناعي لتحريك الصور باستخدام المطالبات النصية


كشف الباحثون في شركة Apple النقاب عن Keyframer، وهو نموذج أولي لأداة الرسوم المتحركة التي تعمل بالذكاء الاصطناعي والتي تمكن المستخدمين من إضافة حركة إلى الصور ثنائية الأبعاد من خلال وصف كيفية تحريكها.

في ورقة بحثية نُشرت في الثامن من فبراير، قالت شركة Apple إن نماذج اللغات الكبيرة (LLMs) “غير مستكشفة” في الرسوم المتحركة على الرغم من الإمكانات التي أظهرتها عبر الوسائط الإبداعية الأخرى مثل الكتابة وتوليد الصور. يتم عرض أداة Keyframer التي تعمل بنظام LLM كمثال واحد لكيفية تطبيق التكنولوجيا.

باستخدام OpenAI’s GPT4 كنموذج أساسي له، يمكن لـ Keyframer أن يأخذ ملفات Scalable Vector Graphic (SVG) – وهو تنسيق توضيحي يمكن تغيير حجمه دون التدخل في الجودة – وإنشاء كود CSS لتحريك الصورة بناءً على مطالبة نصية. ما عليك سوى تحميل الصورة، وكتابة شيء مثل “اجعل النجوم تتلألأ” في مربع المطالبة، ثم الضغط على “إنشاء”. توضح الأمثلة الواردة في ورقة البحث كيف يمكن لرسم زحل أن ينتقل بين ألوان الخلفية، أو يظهر النجوم وهي تتلاشى داخل وخارج المقدمة.

لا يوجد فيديو متاح، ولكن هذه المقارنات إطارًا بإطار هي مثال على إمكانيات Keyframer.
الصورة: أبل

يمكن للمستخدمين إنتاج تصميمات رسوم متحركة متعددة دفعة واحدة، وضبط الخصائص مثل رموز الألوان ومدة الرسوم المتحركة في نافذة منفصلة. ليست هناك حاجة إلى خبرة في البرمجة حيث يقوم Keyframer تلقائيًا بتحويل هذه التغييرات إلى CSS، على الرغم من أن الكود نفسه قابل للتحرير بالكامل أيضًا. يعد هذا النهج القائم على الوصف أبسط بكثير من الأشكال الأخرى للرسوم المتحركة التي ينشئها الذكاء الاصطناعي، والتي تتطلب عادةً العديد من التطبيقات المختلفة وبعض الخبرة في البرمجة.

أدوات التحرير في Keyframer محدودة إلى حد ما، ولكن على الأقل لا تحتاج إلى فهم التعليمات البرمجية لاستخدامها.
الصورة: أبل

قال أحد مصممي الحركة المحترفين الذين شاركوا في أبحاث شركة Apple: “يشعر جزء مني بالقلق بشأن استبدال هذه الأدوات للوظائف، لأن الإمكانيات عالية جدًا. لكنني أعتقد أن التعرف عليها واستخدامها كرسوم متحركة – إنها مجرد أداة أخرى في صندوق أدواتنا. لن يؤدي إلا إلى تحسين مهاراتنا. إنها أشياء مثيرة حقًا.”

ومع ذلك، لا يزال أمامها طريق طويل لنقطعه. Keyframer ليس متاحًا للعامة بعد، وتتكون دراسة المستخدم ضمن ورقة بحث Apple من 13 شخصًا فقط، الذين يمكنهم فقط استخدام صورتين SVG بسيطتين محددتين مسبقًا عند تجربة الأداة.

كانت شركة Apple أيضًا حريصة على ذكر حدودها في الورقة، مع تحديد أن Keyframer يركز على الرسوم المتحركة المستندة إلى الويب مثل تسلسلات التحميل، وتصور البيانات، والانتقالات المتحركة. على النقيض من ذلك، فإن نوع الرسوم المتحركة التي تراها في الأفلام وألعاب الفيديو معقدة للغاية بحيث لا يمكن إنتاجها باستخدام الأوصاف وحدها – في الوقت الحالي على الأقل.

يعد Keyframer أحد ابتكارات الذكاء الاصطناعي العديدة التي أعلنت عنها شركة Apple في الأشهر الأخيرة. في ديسمبر، قدمت الشركة Human Gaussian Splats (HUGS)، والتي يمكنها إنشاء صور رمزية بشرية جاهزة للرسوم المتحركة من مقاطع الفيديو. في الأسبوع الماضي، أصدرت شركة Apple أيضًا نموذج MGIE، وهو نموذج جديد للذكاء الاصطناعي يمكنه تحرير الصور باستخدام الأوصاف النصية.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *