وصول نظام ذكاء اصطناعى إلى المستوى البشرى فى اختبار “الذكاء العام”

حقق نموذج جديد للذكاء الاصطناعي AI نتائج على مستوى البشر في اختبار مصمم لقياس “الذكاء العام”، حيث سجل نظام o3 التابع لشركة OpenAI نسبة 85% في معيار ARC-AGI، وهو أعلى بكثير من أفضل نتيجة سابقة للذكاء الاصطناعي والتي بلغت 55%، ويتساوى مع متوسط النتيجة البشرية، كما سجل نتائج جيدة في اختبار رياضيات صعب للغاية.

وفقا لما ذكره موقع “Techxplore”، فإن إنشاء الذكاء العام الاصطناعي، أو AGI، هو الهدف المعلن لجميع مختبرات أبحاث الذكاء الاصطناعي الرئيسية، ويبدو أن OpenAI قد قطعت خطوة كبيرة على الأقل نحو هذا الهدف.

يشعر العديد من الباحثين والمطورين في مجال الذكاء الاصطناعي أن شيئًا ما قد تغير، وبالنسبة للكثيرين، يبدو احتمال الذكاء العام الاصطناعي الآن أكثر واقعية وإلحاحًا وأقرب مما كان متوقعًا.

كما أنه لفهم ما تعنيه نتيجة o3، تحتاج إلى فهم ما يدور حوله اختبار ARC-AGI، فمن الناحية الفنية، إنه اختبار لـ “كفاءة العينة” لنظام الذكاء الاصطناعي في التكيف مع شيء جديد.

لا يتمتع نظام الذكاء الاصطناعي مثل ChatGPT (GPT-4) بكفاءة كبيرة في التعامل مع العينات، فقد تم “تدريبه” على ملايين الأمثلة من النصوص البشرية، وبناء قواعد احتمالية حول مجموعات الكلمات الأكثر احتمالية، لذلك النتيجة جيدة جدًا في المهام الشائعة، وهو سيئ في المهام غير الشائعة، لأنه يحتوي على بيانات أقل (عينات أقل) حول هذه المهام.

تحتاج أنظمة الذكاء الاصطناعي إلى التعلم من أعداد صغيرة من الأمثلة والتكيف بكفاءة أكبر في التعامل مع العينات، وحتى تصل إلى ذلك، فلن تُستخدم إلا في الوظائف المتكررة للغاية وتلك التي يكون فيها الفشل العرضي مقبولاً.

تُعرف القدرة على حل المشكلات غير المعروفة أو الجديدة بدقة من عينات محدودة من البيانات بالقدرة على التعميم، ويُنظر إليها على نطاق واسع على أنها عنصر ضروري، بل وحتى أساسي، للذكاء.

تشبه اختبارات الـAI اختبارات الذكاء التي قد تتذكرها أحيانًا من المدرسة، ولا نعرف بالضبط كيف فعلت OpenAI ذلك، لكن النتائج تشير إلى أن نموذج o3 قابل للتكيف بدرجة كبيرة، من خلال بضعة أمثلة فقط، يجد قواعد يمكن تعميمها.

بدأت OpenAI بإصدار عام الغرض من نموذج o3، الذي يختلف عن معظم النماذج الأخرى، لأنه يمكن أن يقضي وقتًا أطول في “التفكير” في الأسئلة الصعبة، ثم دربته خصيصًا لاختبار ARC-AGI.

يعتقد الباحث الفرنسي في مجال الذكاء الاصطناعي فرانسوا شوليه، الذي صمم المعيار، أن o3 يبحث من خلال “سلاسل فكرية” مختلفة تصف الخطوات لحل المهمة، ثم يختار “الأفضل” وفقًا لقاعدة غير محددة بشكل واضح، أو “قاعدة استدلالية”.

هذا “لا يختلف كثيراً” عن الطريقة التي بحث بها نظام ألفاجو من جوجل من خلال تسلسلات مختلفة محتملة من الحركات للتغلب على بطل العالم في لعبة جو، ويمكن أن يكون هناك الآلاف من البرامج المختلفة التي تبدو صالحة بنفس القدر.

لا يزال كل شيء تقريبا عن o3 غير معروف، فقد اقتصرت شركة OpenAI على الكشف عن عدد قليل من العروض الإعلامية والاختبارات المبكرة لعدد قليل من الباحثين والمختبرات ومؤسسات سلامة الذكاء الاصطناعي.

كما أن الفهم الحقيقي لإمكانات o3 سيتطلب عملا مكثفا، بما في ذلك التقييمات، وفهم توزيع قدراته، ومدى تكرار فشله ومدى تكرار نجاحه.

عندما يتم إطلاق o3، ستكون لدينا فكرة أفضل كثيرا عما إذا كان قابلا للتكيف تقريبا مثل الإنسان العادي.

وإذا كان الأمر كذلك، فقد يكون له تأثير اقتصادي ضخم وثوري، ويبشر بعصر جديد من الذكاء المتسارع المحسن ذاتيا، وسنحتاج إلى معايير جديدة للذكاء الاصطناعي العام نفسه والتفكير الجاد في كيفية إدارته، وإذا لم يكن الأمر كذلك، فستظل هذه نتيجة مثيرة للإعجاب، ومع ذلك، ستظل الحياة اليومية كما هي إلى حد كبير.