للتفاعل مع العالم الحقيقي، سيكتسب الذكاء الاصطناعي الذكاء الجسدي
نماذج الذكاء الاصطناعي الحديثة تشبه البشر بشكل مدهش في قدرتها على إنشاء النصوص والصوت والفيديو عند الطلب. ومع ذلك، حتى الآن ظلت هذه الخوارزميات إلى حد كبير مقتصرة على العالم الرقمي، بدلاً من العالم المادي ثلاثي الأبعاد الذي نعيش فيه. في الواقع، كلما حاولنا تطبيق هذه النماذج على العالم الحقيقي، نواجه حتى أكثر الصراعات تعقيدًا صعوبة في الأداء بشكل مناسب. – فكر فقط، على سبيل المثال، في مدى صعوبة تطوير سيارات ذاتية القيادة آمنة وموثوقة. على الرغم من كونها ذكية بشكل مصطنع، إلا أن هذه النماذج لا تمتلك أي فهم للفيزياء فحسب، بل إنها غالبًا ما تهلوس، مما يؤدي بها إلى ارتكاب أخطاء لا يمكن تفسيرها.
ومع ذلك، هذا هو العام الذي سيحقق فيه الذكاء الاصطناعي قفزة أخيرًا من العالم الرقمي إلى العالم الحقيقي الذي نعيش فيه. إن توسيع الذكاء الاصطناعي إلى ما هو أبعد من حدوده الرقمية يتطلب إعادة صياغة طريقة تفكير الآلات، ودمج الذكاء الرقمي للذكاء الاصطناعي مع البراعة الميكانيكية للروبوتات. وهذا ما أسميه “الذكاء الجسدي”، وهو شكل جديد من الآلات الذكية التي يمكنها فهم البيئات الديناميكية، والتعامل مع عدم القدرة على التنبؤ، واتخاذ القرارات في الوقت الحقيقي. على عكس النماذج المستخدمة في الذكاء الاصطناعي القياسي، فإن الذكاء الجسدي متجذر في الفيزياء؛ في فهم المبادئ الأساسية للعالم الحقيقي، مثل السبب والنتيجة.
تسمح هذه الميزات لنماذج الذكاء الجسدي بالتفاعل والتكيف مع بيئات مختلفة. في مجموعتي البحثية في معهد ماساتشوستس للتكنولوجيا، نقوم بتطوير نماذج للذكاء الجسدي والتي نسميها الشبكات السائلة. في إحدى التجارب، على سبيل المثال، قمنا بتدريب طائرتين بدون طيار – واحدة يتم تشغيلها بواسطة نموذج قياسي للذكاء الاصطناعي والأخرى بواسطة شبكة سائلة – لتحديد مواقع الأشياء في الغابة خلال فصل الصيف، باستخدام البيانات التي التقطها الطيارون البشريون. في حين كان أداء كلتا الطائرتين جيدًا على قدم المساواة عندما تم تكليفهما بالقيام بالضبط بما تم تدريبهما على القيام به، عندما طُلب منهما تحديد مواقع الأشياء في ظروف مختلفة – خلال فصل الشتاء أو في بيئة حضرية – فقط الطائرة بدون طيار ذات الشبكة السائلة أكملت مهمتها بنجاح. وأظهرت لنا هذه التجربة أنه على عكس أنظمة الذكاء الاصطناعي التقليدية التي تتوقف عن التطور بعد مرحلة التدريب الأولية، تستمر الشبكات السائلة في التعلم والتكيف من التجربة، تمامًا كما يفعل البشر.
كما أن الذكاء الجسدي قادر أيضًا على تفسير وتنفيذ الأوامر المعقدة المستمدة من النصوص أو الصور، مما يسد الفجوة بين التعليمات الرقمية والتنفيذ في العالم الحقيقي. على سبيل المثال، في مختبري، قمنا بتطوير نظام ذكي جسديًا يمكنه، في أقل من دقيقة، تصميم روبوتات صغيرة بشكل متكرر ومن ثم طباعتها ثلاثية الأبعاد بناءً على مطالبات مثل “الروبوت الذي يمكنه المشي للأمام” أو “الروبوت الذي يمكنه الإمساك الأشياء “.
كما تحقق مختبرات أخرى اختراقات كبيرة. على سبيل المثال، تعمل شركة Covariant الناشئة في مجال الروبوتات، والتي أسسها بيتر أبيل، الباحث في جامعة كاليفورنيا في بيركلي، على تطوير روبوتات الدردشة – المشابهة لـ ChatGTP – التي يمكنها التحكم في الأذرع الآلية عند الطلب. لقد حصلوا بالفعل على أكثر من 222 مليون دولار لتطوير ونشر روبوتات الفرز في المستودعات على مستوى العالم. كما أثبت فريق من جامعة كارنيجي ميلون مؤخرًا أن الروبوت المزود بكاميرا واحدة فقط وتشغيل غير دقيق يمكنه أداء حركات الباركور الديناميكية والمعقدة – بما في ذلك القفز على العوائق التي يبلغ ارتفاعها ضعف ارتفاعها وعبر الفجوات التي يبلغ طولها ضعف طولها – باستخدام شبكة عصبية واحدة تم تدريبها عن طريق التعزيز. تعلُّم.
إذا كان عام 2023 هو عام تحويل النص إلى صورة و2024 عام تحويل النص إلى فيديو، فإن عام 2025 سيمثل عصر الذكاء الجسدي، مع جيل جديد من الأجهزة – ليس فقط الروبوتات، ولكن أيضًا كل شيء بدءًا من شبكات الطاقة إلى المنازل الذكية – يمكنها تفسير ما نقوله لهم وتنفيذ المهام في العالم الحقيقي.