ننسى روبوتات الدردشة. وكلاء الذكاء الاصطناعي هم المستقبل

أحدثت شركة ناشئة تدعى Cognition AI هذا الأسبوع ضجة كبيرة من خلال إطلاقها عرض توضيحي يُظهر برنامج ذكاء اصطناعي يُدعى Devin يؤدي العمل الذي يقوم به عادة مهندسو البرمجيات الذين يتقاضون أجوراً جيدة. يمكن لروبوتات الدردشة مثل ChatGPT وGemini إنشاء تعليمات برمجية، لكن ديفين ذهب إلى أبعد من ذلك، حيث خطط لكيفية حل مشكلة ما، وكتابة التعليمات البرمجية، ثم اختبارها وتنفيذها.

يصفه منشئو Devin بأنه “مطور برامج الذكاء الاصطناعي”. عندما طُلب منه اختبار كيفية أداء نموذج اللغة مفتوح المصدر الخاص بـ Meta Llama 2 عند الوصول إليه عبر شركات مختلفة تستضيفه، أنشأ Devin خطة خطوة بخطوة للمشروع، وأنشأ التعليمات البرمجية اللازمة للوصول إلى واجهات برمجة التطبيقات وإجراء اختبارات قياس الأداء، وأنشأ موقعًا على الويب تلخيص النتائج.

من الصعب دائمًا الحكم على العروض التوضيحية التي تم تنظيمها، لكن Cognition أظهر أن Devin يتعامل مع مجموعة واسعة من المهام المثيرة للإعجاب. هو – هي أبهر المستثمرين والمهندسين على X، تلقي الكثير من موافقات، وحتى ملهمة قليلة الميمات– بما في ذلك بعض التنبؤات بأن ديفين سيكون قريبًا مسؤول لموجة من تسريح العمال في صناعة التكنولوجيا.

إن ديفين هو المثال الأحدث والأكثر صقلًا للاتجاه الذي كنت أتتبعه منذ فترة، ألا وهو ظهور عملاء الذكاء الاصطناعي الذين بدلاً من مجرد تقديم إجابات أو نصائح حول مشكلة يقدمها الإنسان، يمكنهم اتخاذ إجراءات لحلها. قبل بضعة أشهر قمت باختبار Auto-GPT، وهو برنامج مفتوح المصدر يحاول القيام بالأعمال المنزلية المفيدة من خلال اتخاذ إجراءات على كمبيوتر الشخص وعلى الويب. لقد اختبرت مؤخرًا برنامجًا آخر يسمى vimGPT لأرى كيف يمكن للمهارات البصرية لنماذج الذكاء الاصطناعي الجديدة أن تساعد هؤلاء الوكلاء على تصفح الويب بكفاءة أكبر.

لقد تأثرت بتجاربي مع هؤلاء العملاء. ومع ذلك، في الوقت الحالي، تمامًا مثل نماذج اللغة التي تدعمها، فإنها ترتكب عددًا لا بأس به من الأخطاء. وعندما يتخذ أحد البرامج إجراءات، وليس مجرد إنشاء نص، فإن خطأ واحد يمكن أن يعني الفشل التام – وربما عواقب مكلفة أو خطيرة. إن تضييق نطاق المهام التي يمكن للوكيل القيام بها، على سبيل المثال، لمجموعة معينة من مهام هندسة البرمجيات، يبدو وكأنه طريقة ذكية لتقليل معدل الخطأ، ولكن لا تزال هناك العديد من الطرق المحتملة للفشل.

لا تقوم الشركات الناشئة فقط ببناء عملاء الذكاء الاصطناعي. كتبت في وقت سابق من هذا الأسبوع عن وكيل يُدعى SIMA، تم تطويره بواسطة Google DeepMind، والذي يلعب ألعاب الفيديو بما في ذلك عنوان الجنون حقًا محاكاة الماعز 3. تعلمت SIMA من خلال مشاهدة اللاعبين البشريين كيفية القيام بأكثر من 600 مهمة معقدة إلى حد ما مثل تقطيع شجرة أو إطلاق النار على كويكب. والأهم من ذلك، أنه يمكنه تنفيذ العديد من هذه الإجراءات بنجاح حتى في لعبة غير مألوفة. جوجل DeepMind يطلق عليه اسم “العامة”.

أظن أن جوجل تأمل أن يذهب هؤلاء العملاء في نهاية المطاف إلى العمل خارج نطاق ألعاب الفيديو، وربما يساعدون في استخدام الويب نيابة عن المستخدم أو تشغيل البرامج لهم. لكن ألعاب الفيديو تشكل بيئة رملية جيدة لتطوير واختبار الوكلاء، من خلال توفير بيئات معقدة يمكن اختبارهم فيها وتحسينهم. قال لي تيم هارلي، عالم الأبحاث في Google DeepMind: “إن جعلها أكثر دقة هو أمر نعمل عليه بنشاط”. “لدينا أفكار مختلفة.”

يمكنك توقع المزيد من الأخبار حول عملاء الذكاء الاصطناعي في الأشهر المقبلة. أخبرني ديميس هاسابيس، الرئيس التنفيذي لشركة Google DeepMind، مؤخرًا أنه يخطط للجمع بين نماذج لغوية كبيرة والعمل الذي قامت به شركته سابقًا لتدريب برامج الذكاء الاصطناعي لممارسة ألعاب الفيديو لتطوير عملاء أكثر قدرة وموثوقية. “هذه بالتأكيد منطقة ضخمة. نحن نستثمر بكثافة في هذا الاتجاه، وأتصور أن الآخرين يفعلون ذلك أيضًا». قال حسبيس. “سيكون هذا تغييرًا تدريجيًا في قدرات هذه الأنواع من الأنظمة – عندما تبدأ في أن تصبح أكثر شبهاً بالوكلاء.”