ميتا تطلق نموذج ذكاء اصطناعى يمكنه التحقق من عمل النماذج الأخرى
قالت شركة Meta، مالكة موقع Facebook، إنها ستصدر مجموعة من نماذج الذكاء الاصطناعي الجديدة من قسم الأبحاث الخاص بها، بما في ذلك “المُقيِّم الذاتي” الذي قد يوفر مسارًا نحو مشاركة بشرية أقل في عملية تطوير الذكاء الاصطناعي.
ويأتي الإصدار بعد تقديم Meta للأداة في ورقة بحثية في أغسطس، والتي توضح بالتفصيل كيف تعتمد على نفس تقنية “سلسلة الفكر” المستخدمة في نماذج o1 التي أصدرتها OpenAI مؤخرًا لجعلها تصدر أحكامًا موثوقة حول استجابات النماذج.
وتتضمن هذه التقنية تقسيم المشكلات المعقدة إلى خطوات منطقية أصغر ويبدو أنها تعمل على تحسين دقة الاستجابات للمشكلات الصعبة في مواضيع مثل العلوم والترميز والرياضيات، واستخدم باحثو Meta بيانات تم إنشاؤها بالكامل بواسطة الذكاء الاصطناعي لتدريب نموذج المُقيِّم، مما أدى إلى القضاء على المدخلات البشرية في تلك المرحلة أيضًا.
وقال اثنان من الباحثين في Meta وراء المشروع لرويترز إن القدرة على استخدام الذكاء الاصطناعي لتقييم الذكاء الاصطناعي بشكل موثوق تقدم لمحة عن مسار محتمل نحو بناء وكلاء ذكاء اصطناعي مستقلين يمكنهم التعلم من أخطائهم.
ويتصور العديد من العاملين في مجال الذكاء الاصطناعي أن مثل هذه الوكلاء هم مساعدون رقميون أذكياء بما يكفي للقيام بمجموعة واسعة من المهام دون تدخل بشري، وقد تقطع النماذج ذاتية التحسين الحاجة إلى عملية مكلفة وغير فعالة تستخدم اليوم تسمى التعلم التعزيزي من ردود الفعل البشرية، والتي تتطلب مدخلات من المعلقين البشريين الذين يجب أن يكون لديهم خبرة متخصصة لتصنيف البيانات بدقة والتحقق من صحة إجابات الاستعلامات المعقدة في الرياضيات والكتابة.
وقال جيسون ويستون، أحد الباحثين: “نأمل، مع تزايد قدرة الذكاء الاصطناعي على تجاوز قدرات البشر، أن يصبح أفضل وأفضل في التحقق من عمله، بحيث يكون أفضل من الإنسان العادي”، وقال: “إن فكرة التعلم الذاتي والقدرة على تقييم الذات أمر بالغ الأهمية للوصول إلى هذا المستوى الخارق للذكاء الاصطناعي”.
كما نشرت شركات أخرى بما في ذلك جوجل وأنثروبيك أبحاثًا حول مفهوم التعلم التعزيزي من ردود الفعل البشرية. ولكن على عكس ميتا، تميل هذه الشركات إلى عدم إصدار نماذجها للاستخدام العام.
وتضمنت أدوات الذكاء الاصطناعي الأخرى التي أصدرتها شركة Meta تحديثًا لنموذج التعرف على الصور Segment Anything الخاص بالشركة، وهي أداة تعمل على تسريع أوقات توليد استجابة LLM ومجموعات البيانات التي يمكن استخدامها للمساعدة في اكتشاف مواد غير عضوية جديدة.