يساعد الذكاء الاصطناعي “Cosmos” من Nvidia الروبوتات البشرية على التنقل حول العالم
أعلنت شركة Nvidia اليوم أنها ستطلق مجموعة من نماذج الذكاء الاصطناعي الأساسية تسمى Cosmos والتي يمكن استخدامها لتدريب الروبوتات البشرية والروبوتات الصناعية والسيارات ذاتية القيادة. بينما تتعلم نماذج اللغة كيفية إنشاء نص من خلال التدريب على كميات وفيرة من الكتب والمقالات ومنشورات وسائل التواصل الاجتماعي، تم تصميم Cosmos لإنشاء صور ونماذج ثلاثية الأبعاد للعالم المادي.
خلال العرض التقديمي الرئيسي في مؤتمر CES السنوي في لاس فيجاس، أظهر الرئيس التنفيذي لشركة Nvidia Jensen Huang أمثلة على استخدام Cosmos لمحاكاة الأنشطة داخل المستودعات. وقال جنسن إن كوزموس تم تدريبه على 20 مليون ساعة من اللقطات الحقيقية “لبشر يسيرون، ويتحركون بأيديهم، ويتلاعبون بالأشياء”. “لا يتعلق الأمر بإنتاج محتوى إبداعي، بل بتعليم الذكاء الاصطناعي فهم العالم المادي.”
ويأمل الباحثون والشركات الناشئة أن تمنح هذه الأنواع من النماذج الأساسية الروبوتات المستخدمة في المصانع والمنازل قدرات أكثر تطوراً. يمكن لبرنامج Cosmos، على سبيل المثال، إنشاء صناديق لقطات فيديو واقعية تسقط من الرفوف داخل أحد المستودعات، والتي يمكن استخدامها لتدريب الروبوت على التعرف على الحوادث. يمكن للمستخدمين أيضًا ضبط النماذج باستخدام بياناتهم الخاصة.
تقول Nvidia إن عددًا من الشركات تستخدم بالفعل Cosmos، بما في ذلك شركات الروبوتات الناشئة Agility وFiger AI بالإضافة إلى شركات السيارات ذاتية القيادة مثل Uber وWaabi وWayve.
أعلنت Nvidia أيضًا عن برنامج مصمم لمساعدة أنواع مختلفة من الروبوتات على تعلم أداء مهام جديدة بشكل أكثر كفاءة. الميزة الجديدة هي جزء من منصة محاكاة الروبوت Isaac الموجودة في Nvidia والتي ستسمح لمصنعي الروبوتات بأخذ عدد صغير من الأمثلة للمهمة المطلوبة، مثل الإمساك بجسم معين، وتوليد كميات كبيرة من بيانات التدريب الاصطناعية.
وتأمل إنفيديا أن يجذب مشروعا Cosmos وIsaac الشركات التي تتطلع إلى بناء واستخدام الروبوتات البشرية. انضمت إلى جنسن على خشبة المسرح في معرض CES صور بالحجم الطبيعي لـ 14 روبوتًا بشريًا مختلفًا طورتها شركات بما في ذلك Tesla وBoston Dynamics وAgility وFig.
جنبا إلى جنب مع Cosmos، أعلنت Nvidia أيضًا عن Project Digits، وهو “كمبيوتر شخصي فائق الذكاء الاصطناعي” بقيمة 3000 دولار يمكنه تشغيل نموذج لغة كبير يصل إلى 200 مليار معلمة دون الحاجة إلى الخدمات السحابية من أمثال AWS أو Microsoft. كما أعلنت أيضًا عن الجيل التالي المرتقب من وحدات معالجة الرسوميات RTX Blackwell، وأدوات البرامج القادمة للمساعدة في بناء عملاء الذكاء الاصطناعي.