نموذج الذكاء الاصطناعي مفتوح المصدر الأكثر قدرة حتى الآن يمكنه تعزيز وكلاء الذكاء الاصطناعي


يمكن لنموذج الذكاء الاصطناعي مفتوح المصدر الأكثر قدرة والذي يتمتع بقدرات بصرية أن يرى المزيد من المطورين والباحثين والشركات الناشئة يطورون عملاء ذكاء اصطناعي يمكنهم تنفيذ أعمال مفيدة على أجهزة الكمبيوتر لديك.

أطلق اليوم معهد ألين للذكاء الاصطناعي (Ai2)، نموذج اللغة المفتوحة متعدد الوسائط، أو Molmo، الذي يمكنه تفسير الصور وكذلك التحدث من خلال واجهة الدردشة. وهذا يعني أنه يمكن أن يفهم شاشة الكمبيوتر، مما قد يساعد وكيل الذكاء الاصطناعي في أداء مهام مثل تصفح الويب، والتنقل عبر أدلة الملفات، وصياغة المستندات.

يقول علي فرهادي، الرئيس التنفيذي لمنظمة Ai2، وهي منظمة بحثية مقرها في سياتل، واشنطن، وعالم كمبيوتر في جامعة واشنطن: “مع هذا الإصدار، يمكن لعدد أكبر من الأشخاص نشر نموذج متعدد الوسائط”. “يجب أن يكون عامل تمكين لتطبيقات الجيل التالي.”

يتم الترويج لما يسمى بوكلاء الذكاء الاصطناعي على نطاق واسع باعتباره الشيء الكبير التالي في مجال الذكاء الاصطناعي، حيث تتسابق شركة OpenAI وجوجل وغيرهما لتطويرهم. لقد أصبح الوكلاء كلمة طنانة في الآونة الأخيرة، ولكن الرؤية الكبرى تتمثل في أن يذهب الذكاء الاصطناعي إلى ما هو أبعد من الدردشة ليقوم بشكل موثوق باتخاذ إجراءات معقدة ومتطورة على أجهزة الكمبيوتر عند إعطائه أمراً. وهذه القدرة لم تتحقق بعد على أي نطاق.

تتمتع بعض نماذج الذكاء الاصطناعي القوية بالفعل بقدرات بصرية، بما في ذلك GPT-4 من OpenAI، وClaude من Anthropic، وGemini من Google DeepMind. يمكن استخدام هذه النماذج لتشغيل بعض عوامل الذكاء الاصطناعي التجريبية، ولكنها مخفية عن الأنظار ولا يمكن الوصول إليها إلا عبر واجهة برمجة التطبيقات المدفوعة، أو API.

أصدرت Meta مجموعة من نماذج الذكاء الاصطناعي تسمى Llama بموجب ترخيص يحد من استخدامها التجاري، لكنها لم تزود المطورين بعد بنسخة متعددة الوسائط. من المتوقع أن تعلن Meta عن العديد من المنتجات الجديدة، ربما بما في ذلك نماذج Llama AI الجديدة، في حدث Connect الخاص بها اليوم.

يقول أوفير بريس، باحث ما بعد الدكتوراه في جامعة برينستون والذي يعمل على عملاء الذكاء الاصطناعي: “إن وجود نموذج مفتوح المصدر ومتعدد الوسائط يعني أن أي شركة ناشئة أو باحث لديه فكرة يمكنه محاولة تنفيذها”.

يقول بريس إن حقيقة كون Molmo مفتوح المصدر يعني أن المطورين سيكونون قادرين بسهولة أكبر على ضبط وكلائهم للقيام بمهام محددة، مثل العمل مع جداول البيانات، من خلال توفير بيانات تدريب إضافية. لا يمكن ضبط النماذج مثل GPT-4 إلا بدرجة محدودة من خلال واجهات برمجة التطبيقات الخاصة بها، في حين يمكن تعديل النموذج المفتوح بالكامل على نطاق واسع. يقول بريس: “عندما يكون لديك نموذج مفتوح المصدر مثل هذا، يكون لديك العديد من الخيارات الأخرى”.

تطلق Ai2 عدة أحجام من Molmo اليوم، بما في ذلك نموذج ذو 70 مليار معلمة ونموذج ذو مليار معلمة وهو صغير بما يكفي للتشغيل على جهاز محمول. يشير عدد معلمات النموذج إلى عدد الوحدات التي يحتوي عليها لتخزين البيانات ومعالجتها ويتوافق تقريبًا مع قدراته.

وتقول Ai2 إن مولمو يتمتع بنفس القدرة التي تتمتع بها النماذج التجارية الأكبر حجمًا على الرغم من صغر حجمها نسبيًا، لأنه تم تدريبها بعناية على البيانات عالية الجودة. النموذج الجديد أيضًا مفتوح المصدر بالكامل، حيث أنه، على عكس Meta’s Llama، لا توجد قيود على استخدامه. يقوم Ai2 أيضًا بإصدار بيانات التدريب المستخدمة لإنشاء النموذج، مما يوفر للباحثين مزيدًا من التفاصيل حول طريقة عمله.

إن إطلاق النماذج القوية لا يخلو من المخاطر. ومن الممكن بسهولة أكبر تكييف مثل هذه النماذج لتحقيق أهداف شائنة؛ قد نشهد يومًا ما، على سبيل المثال، ظهور عوامل ذكاء اصطناعي ضارة مصممة لأتمتة عملية اختراق أنظمة الكمبيوتر.

يقول فرهادي من Ai2 إن كفاءة Molmo وقابليتها للنقل ستسمح للمطورين ببناء وكلاء برمجيات أكثر قوة يتم تشغيلهم محليًا على الهواتف الذكية والأجهزة المحمولة الأخرى. ويقول: “إن نموذج المليار معلمة يؤدي الآن مستوى أو في مستوى النماذج التي هي أكبر بعشر مرات على الأقل”.

ومع ذلك، قد يعتمد بناء عوامل الذكاء الاصطناعي المفيدة على أكثر من مجرد نماذج متعددة الوسائط أكثر كفاءة. ويتمثل التحدي الرئيسي في جعل النماذج تعمل بشكل أكثر موثوقية. قد يتطلب هذا المزيد من الإنجازات في قدرات الذكاء الاصطناعي على التفكير، وهو الأمر الذي سعت شركة OpenAI إلى معالجته باستخدام أحدث نموذج لها o1، والذي يوضح مهارات التفكير خطوة بخطوة. وربما تكون الخطوة التالية هي منح النماذج متعددة الوسائط مثل هذه القدرات المنطقية.

في الوقت الحالي، يعني إطلاق Molmo أن عملاء الذكاء الاصطناعي أصبحوا أقرب من أي وقت مضى، وقد يكون مفيدًا قريبًا حتى خارج العمالقة الذين يحكمون عالم الذكاء الاصطناعي.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *