داخل إنشاء DBRX، أقوى نموذج للذكاء الاصطناعي مفتوح المصدر في العالم
في يوم الاثنين الماضي، اجتمع حوالي عشرة مهندسين ومديرين تنفيذيين في شركة Databricks لعلوم البيانات والذكاء الاصطناعي في قاعات اجتماعات متصلة عبر Zoom لمعرفة ما إذا كانوا قد نجحوا في بناء نموذج لغة ذكاء اصطناعي أعلى. لقد أمضى الفريق أشهرًا، وحوالي 10 ملايين دولار، في تدريب DBRX، وهو نموذج لغوي كبير يشبه في تصميمه النموذج الموجود خلف ChatGPT الخاص بشركة OpenAI. لكنهم لن يعرفوا مدى قوة ابتكارهم حتى تظهر نتائج الاختبارات النهائية لقدراته.
“لقد تجاوزنا كل شيء”، هذا ما قاله جوناثان فرانكل، كبير مهندسي الشبكات العصبية في Databricks وقائد الفريق الذي أنشأ DBRX، للفريق في النهاية، الذي استجاب له بالتصفيق والهتافات والرموز التعبيرية. عادة ما يتجنب فرانكل تناول الكافيين، لكنه كان يتناول رشفات من اللاتيه المثلج بعد قضاء الليل كله لكتابة النتائج.
ستقوم Databricks بإصدار DBRX بموجب ترخيص مفتوح المصدر، مما يسمح للآخرين بالبناء على عملها. شارك فرانكل البيانات التي توضح أنه عبر حوالي اثني عشر معيارًا أو نحو ذلك لقياس قدرة نموذج الذكاء الاصطناعي على الإجابة على أسئلة المعرفة العامة، وأداء فهم القراءة، وحل الألغاز المنطقية المزعجة، وإنشاء تعليمات برمجية عالية الجودة، كان DBRX أفضل من أي نموذج آخر مفتوح المصدر متاح.
لقد تفوقت على Meta’s Llama 2 وMistral’s Mixtral، وهما من أشهر نماذج الذكاء الاصطناعي مفتوحة المصدر المتاحة اليوم. “نعم!” صاح علي قدسي، الرئيس التنفيذي لشركة Databricks، عندما ظهرت النتائج. “انتظر، هل تغلبنا على أمر إيلون؟” أجاب فرانكل بأنهم قد تجاوزوا بالفعل نموذج Grok AI الذي تم فتحه مؤخرًا بواسطة XAI الخاص بـ Musk، مضيفًا: “سأعتبره نجاحًا إذا تلقينا منه تغريدة سيئة”.
ولمفاجأة الفريق، كان DBRX أيضًا، في عدة درجات، قريبًا بشكل صادم من GPT-4، وهو نموذج OpenAI المغلق الذي يشغل ChatGPT ويعتبر على نطاق واسع قمة الذكاء الآلي. قال فرانكل بابتسامة عريضة: “لقد وضعنا مستوىً جديدًا من التقدم لحاملي شهادة LLM مفتوحة المصدر”.
اللبنات
ومن خلال المصادر المفتوحة، تضيف DBRX Databricks المزيد من الزخم إلى الحركة التي تتحدى النهج السري لأبرز الشركات في طفرة الذكاء الاصطناعي التوليدية الحالية. تحتفظ شركتا OpenAI وGoogle برمز نماذج اللغات الكبيرة GPT-4 وGemini بشكل وثيق، لكن بعض المنافسين، ولا سيما Meta، أصدروا نماذجهم ليستخدمها الآخرون، بحجة أنها ستحفز الابتكار من خلال وضع التكنولوجيا في أيدي المزيد من الأشخاص. الباحثين ورجال الأعمال والشركات الناشئة والشركات القائمة.
وتقول Databricks إنها تريد أيضًا الانفتاح على العمل المتضمن في إنشاء نموذجها مفتوح المصدر، وهو الأمر الذي لم تفعله Meta في بعض التفاصيل الأساسية حول إنشاء نموذج Llama 2. ستقوم الشركة بإصدار منشور مدونة يوضح بالتفصيل العمل المطلوب لإنشاء النموذج، كما دعت WIRED أيضًا لقضاء بعض الوقت مع مهندسي Databricks حيث اتخذوا قرارات رئيسية خلال المراحل النهائية من عملية تدريب DBRX التي تبلغ تكلفتها ملايين الدولارات. لقد قدم ذلك لمحة عن مدى التعقيد والتحدي الذي يمثله بناء نموذج رائد للذكاء الاصطناعي – ولكن أيضًا كيف تبشر الابتكارات الحديثة في هذا المجال بخفض التكاليف. ويشير ذلك، إلى جانب توفر نماذج مفتوحة المصدر مثل DBRX، إلى أن تطوير الذكاء الاصطناعي ليس على وشك التباطؤ في أي وقت قريب.
يقول علي فرهادي، الرئيس التنفيذي لمعهد ألين للذكاء الاصطناعي، إن هناك حاجة ماسة إلى قدر أكبر من الشفافية حول بناء نماذج الذكاء الاصطناعي وتدريبها. أصبح هذا المجال سريًا بشكل متزايد في السنوات الأخيرة حيث سعت الشركات إلى التفوق على المنافسين. ويقول إن العتامة مهمة بشكل خاص عندما يكون هناك قلق بشأن المخاطر التي قد تشكلها نماذج الذكاء الاصطناعي المتقدمة. يقول فرهادي: “أنا سعيد جدًا برؤية أي جهد في الانفتاح”. “أعتقد أن جزءًا كبيرًا من السوق سوف يتجه نحو النماذج المفتوحة. نحن بحاجة إلى المزيد من هذا.”