Meta’s Open Source Llama 3 تقترب بالفعل من OpenAI
لدى جيروم بيسنتي عدة أسباب للاحتفال بقرار Meta الأسبوع الماضي بإصدار Llama 3، وهو نموذج لغة كبير مفتوح المصدر قوي يمكن لأي شخص تنزيله وتشغيله والبناء عليه.
كان بيسينتي يشغل منصب نائب رئيس قسم الذكاء الاصطناعي في شركة Meta، ويقول إنه غالبًا ما كان يدفع الشركة إلى التفكير في إطلاق تقنيتها ليستخدمها الآخرون ويبني عليها. لكن السبب الرئيسي الذي يجعله سعيدًا هو أن شركته الناشئة الجديدة ستتمكن من الوصول إلى نموذج الذكاء الاصطناعي الذي يقول إنه قريب جدًا من قوة مولد النصوص الرائد في الصناعة GPT-4 من OpenAI، ولكنه أرخص بكثير في التشغيل وأكثر انفتاحًا على الخارج. التدقيق والتعديل.
يقول بيسنتي: “إن الإصدار يوم الجمعة الماضي يبدو وكأنه يغير قواعد اللعبة”. تستخدم شركته الجديدة، Sizzle، وهي معلمة للذكاء الاصطناعي، حاليًا GPT-4 ونماذج الذكاء الاصطناعي الأخرى، المغلقة والمفتوحة، لصياغة مجموعات المشكلات والمناهج الدراسية للطلاب. يقوم مهندسوه بتقييم ما إذا كان Llama 3 يمكن أن يحل محل نموذج OpenAI في كثير من الحالات.
قد تبشر قصة Sizzle بتحول أوسع في ميزان القوى في الذكاء الاصطناعي. غيرت OpenAI العالم من خلال ChatGPT، مما أدى إلى إطلاق موجة من الاستثمار في الذكاء الاصطناعي وجذب أكثر من 2 مليون مطور إلى واجهات برمجة التطبيقات السحابية الخاصة بها. ولكن إذا أثبتت النماذج مفتوحة المصدر قدرتها على المنافسة، فقد يقرر المطورون ورجال الأعمال التوقف عن الدفع للوصول إلى أحدث نموذج من OpenAI أو Google واستخدام Llama 3 أو أحد النماذج الأخرى مفتوحة المصدر القوية بشكل متزايد والتي ظهرت.
يقول بيسينتي عن المنافسة بين النماذج المفتوحة مثل Llama 3 والنماذج المغلقة مثل GPT-4 وGemini من Google: “سيكون سباق خيول مثيرًا للاهتمام”.
كان نموذج ميتا السابق، Llama 2، مؤثرًا بالفعل، لكن الشركة تقول إنها جعلت الإصدار الأخير أكثر قوة من خلال تزويده بكميات أكبر من بيانات التدريب عالية الجودة، مع تطوير تقنيات جديدة لتصفية المحتوى الزائد أو المشوه و حدد أفضل مزيج من مجموعات البيانات لاستخدامه.
يقول Pesenti إن تشغيل Llama 3 على منصة سحابية مثل Fireworks.ai لا يكلف سوى 20 من تكلفة الوصول إلى GPT-4 من خلال واجهة برمجة التطبيقات. ويضيف أنه يمكن تكوين Llama 3 للرد على الاستفسارات بسرعة كبيرة، وهو اعتبار رئيسي للمطورين في شركات مثل شركته التي تعتمد على الاستفادة من النماذج من مقدمي خدمات مختلفين. يقول: “إنها معادلة بين زمن الوصول والتكلفة والدقة”.
يبدو أن النماذج المفتوحة تسقط في مقطع مثير للإعجاب. قبل بضعة أسابيع، ذهبت إلى شركة Databricks الناشئة لأشهد المراحل النهائية من الجهود المبذولة لبناء DBRX، وهو نموذج لغة تم إنشاؤه والذي كان لفترة وجيزة أفضل نموذج مفتوح على الإطلاق. هذا التاج هو الآن Llama 3. كما يصف علي قدسي، الرئيس التنفيذي لشركة Databricks، Llama 3 بأنه “يغير قواعد اللعبة” ويقول إن النموذج الأكبر “يقترب من جودة GPT 4 – التي تساوي مجال اللعب بين LLMs مفتوحة المصدر ومغلقة المصدر”.
تعرض Llama 3 أيضًا إمكانية جعل نماذج الذكاء الاصطناعي أصغر حجمًا، بحيث يمكن تشغيلها على أجهزة أقل قوة. أصدرت Meta نسختين من أحدث نموذج لها، أحدهما يحتوي على 70 مليار معلمة – وهو مقياس للمتغيرات التي تستخدمها للتعلم من بيانات التدريب – والآخر يحتوي على 8 مليار معلمة. النموذج الأصغر حجمًا صغير الحجم بما يكفي لتشغيله على جهاز كمبيوتر محمول ولكنه قادر بشكل ملحوظ، على الأقل في اختبارات WIRED.
قبل يومين من إصدار Meta، قامت شركة Mistral، وهي شركة فرنسية للذكاء الاصطناعي أسسها خريجو فريق Pesenti في Meta، بفتح Mixtral 8x22B مفتوح المصدر. فهو يحتوي على 141 مليار معلمة ولكنه يستخدم 39 مليارًا منها فقط في أي وقت، وهو تصميم يُعرف باسم مزيج من الخبراء. بفضل هذه الخدعة، أصبح النموذج أكثر قدرة بكثير من بعض النماذج الأكبر حجمًا.
Meta ليست شركة التكنولوجيا العملاقة الوحيدة التي تطلق الذكاء الاصطناعي مفتوح المصدر. أصدرت Microsoft هذا الأسبوع Phi-3-mini وأصدرت Apple OpenELM، وهما نموذجان صغيران لكنهما قادران على الاستخدام المجاني ويمكن تشغيلهما على الهاتف الذكي.
ستظهر الأشهر المقبلة ما إذا كان Llama 3 والنماذج المفتوحة الأخرى يمكنها حقًا أن تحل محل نماذج الذكاء الاصطناعي المتميزة مثل GPT-4 لبعض المطورين. وهناك المزيد من الذكاء الاصطناعي مفتوح المصدر قادم. وتعمل الشركة على إصدار ضخم يضم 400 مليار معلمة من Llama 3، والذي يقول كبير علماء الذكاء الاصطناعي Yann LeCun إنه ينبغي أن يكون واحدًا من أكثر الإصدارات قدرة في العالم.
وبطبيعة الحال، كل هذا الانفتاح ليس مجرد إيثار. يقول مارك زوكربيرج، الرئيس التنفيذي لشركة Meta، إنه يفتح نماذج الذكاء الاصطناعي الخاصة به يجب أن يفيد الشركة في النهاية من خلال خفض تكلفة التقنيات التي تعتمد عليها، على سبيل المثال من خلال إنتاج أدوات وخدمات متوافقة يمكن أن تستخدمها Meta لنفسها. ولم يقل أنه قد يكون من مصلحة Meta أيضًا منع OpenAI أو Microsoft أو Google من السيطرة على المجال.