لقد تم إطلاق النار على ديبسيك

لقد مر ما يزيد قليلاً عن أسبوع منذ أن قام Deepseek برفع عالم الذكاء الاصطناعي. إن إدخال طرازه المفتوح الوزن-الذي تم تدريبه على ما يبدو على جزء صغير من رقائق الحوسبة المتخصصة التي يقوم بها قادة صناعة الطاقة-بإلغاء موجات الصدمة داخل Openai. لم يزعم الموظفون فقط أنهم يرون تلميحات إلى أن Deepseek كان لديه نماذج Openai بشكل غير لائق “لإنشاء خاص بها ، ولكن نجاح بدء التشغيل كان في وول ستريت يتساءل عما إذا كانت شركات مثل Openai كانت في وضع زيادة في الاعتبار.

“Deepseek R1 هي لحظة سبوتنيك من الذكاء الاصطناعي” ، كتب مارك أندريسن ، أحد أكثر المخترعين نفوذاً واستفزازيًا في السيليكون ، على X.

رداً على ذلك ، تستعد Openai لإطلاق نموذج جديد اليوم ، قبل جدوله المخطط في الأصل. سوف لاول مرة النموذج ، O3-MINI ، في كل من API والدردشة. تقول المصادر أنها تحتوي على منطق مستوى O1 مع سرعة مستوى 4o. بمعنى آخر ، إنها سريعة ورخيصة وذكية ومصممة لسحق Deepseek.

لقد حفزت اللحظة موظفي Openai. داخل الشركة ، هناك شعور بأنه – خاصةً كما يهيمن Deepseek على المحادثة – يجب أن يصبح Openai أكثر كفاءة أو مخاطرة تتخلف عن أحدث منافسها.

ينبع جزء من القضية من أصول Openai كمنظمة بحثية غير ربحية قبل أن تصبح قوة تسعى للربح. يزعم الموظفون أن صراعًا مستمرًا للسلطة بين مجموعات البحث ومجموعات المنتجات قد أدى إلى خلاف بين الفرق التي تعمل على التفكير المتقدم وأولئك الذين يعملون في الدردشة. (يقول المتحدث الرسمي باسم Openai نيكو فيليكس إن هذا “غير صحيح” ويلاحظ أن قادة هذه الفرق ، كبير مسؤولي المنتج كيفن ويل وكبير موظفي الأبحاث مارك تشن ، “يجتمع كل أسبوع ويعملون عن كثب على التوافق على أولويات المنتج والبحث.”)

يريد البعض داخل Openai من الشركة إنشاء منتج دردشة موحد ، وهو نموذج واحد يمكنه معرفة ما إذا كان السؤال يتطلب التفكير المتقدم. حتى الآن ، هذا لم يحدث. بدلاً من ذلك ، تطالب القائمة المنسدلة في ChatGPT للمستخدمين بتحديد ما إذا كانوا يرغبون في استخدام GPT-4O (“رائع لمعظم الأسئلة”) أو O1 (“يستخدم التفكير المتقدم”).

يزعم بعض الموظفين أنه على الرغم من أن الدردشة تجلب حصة الأسد من إيرادات Openai ، فإن O1 يحظى بمزيد من الاهتمام – وحساب الموارد – من القيادة. يقول موظف سابق عمل على الدردشة (خمنت ذلك): “القيادة لا تهتم بالدردشة”. “الكل يريد العمل على O1 لأنه مثير ، لكن قاعدة التعليمات البرمجية لم يتم تصميمها للتجربة ، لذلك لا يوجد زخم.” طلب الموظف السابق أن يظل مجهول الهوية ، مشيرا إلى اتفاق عدم الإفصاح.

أمضى Openai سنوات في تجربة التعلم التعزيز لضبط النموذج الذي أصبح في النهاية نظام التفكير المتقدم يسمى O1. (التعلم التعزيز هو عملية تدرب نماذج الذكاء الاصطناعى مع نظام من العقوبات والمكافآت.) بنيت Deepseek من أعمال التعلم التعزيز التي كان Openai رائدة من أجل إنشاء نظام التفكير المتقدم ، يسمى R1. يقول باحث سابق في Openai الذي لم يكن مخولًا للتحدث علنًا عن الشركة: “لقد استفادوا من معرفة أن التعلم التعزيز ، الذي تم تطبيقه على نماذج اللغة ، يعمل”.

“تعلم التعزيز [DeepSeek] يقول باحث سابق في Openai: “لقد كان مشابهًا لما فعلناه في Openai ، لكنهم فعلوا ذلك ببيانات أفضل ومكدس أنظف”.

يقول موظفو Openai إن الأبحاث التي دخلت O1 تم في قاعدة رمز ، تسمى مكدس “التوت” ، الذي تم تصميمه للسرعة. يقول أحد الموظفين السابقين مع المعرفة المباشرة بالوضع: “كانت هناك مفاضلات-صرامة تجريبية للإنتاجية”.

كانت هذه المفاضلات منطقية بالنسبة لـ O1 ، والتي كانت في الأساس تجربة هائلة ، على الرغم من قيود قاعدة الكود. لم يكونوا منطقيين على الدردشة ، وهو منتج يستخدمه ملايين المستخدمين الذين تم بناؤهم على مجموعة مختلفة وأكثر موثوقية. عندما أطلقت O1 وأصبحت منتجًا ، بدأت الشقوق في الظهور في العمليات الداخلية لـ Openai. “كان الأمر كذلك ،” لماذا نفعل هذا في قاعدة الشفرة التجريبية ، ألا ينبغي لنا أن نفعل ذلك في قاعدة كود أبحاث المنتجات الرئيسية؟ “، يوضح الموظف. “كان هناك تراجع كبير إلى ذلك داخليًا.”