يطلق الأنثروبور أول نموذج “التفكير الهجين” في العالم


الفرق بين النموذج التقليدي والمنطق يشبه نوعين من التفكير الموصوف من قبل الاقتصادي الحائز على جائزة نوبل مايكل كهينمان في كتابه 2011 التفكير بسرعة وبطيئة: التفكير السريع والغريزي-1 التفكير وأبطأ أكثر تفكير نظام التداول -2.

إن نوع النموذج الذي جعل chatgpt ممكنًا ، والمعروف باسم نموذج اللغة الكبيرة أو LLM ، ينتج استجابات فورية لمطالبة من خلال الاستعلام عن شبكة عصبية كبيرة. يمكن أن تكون هذه المخرجات ذكية ومتماسكة بشكل لافت ولكنها قد تفشل في الإجابة على الأسئلة التي تتطلب التفكير خطوة بخطوة ، بما في ذلك الحساب البسيط.

يمكن إجبار LLM على تقليد التفكير التداولي إذا تم توجيه تعليمات إلى التوصل إلى خطة يجب أن تتبعها بعد ذلك. هذه الخدعة ليست موثوقة دائمًا ، وعادة ما تكافح النماذج من أجل حل المشكلات التي تتطلب تخطيطًا واسعًا ودقيقًا. تستخدم Openai و Google والآن الأنثروبري الآن طريقة تعلم آلي تُعرف باسم التعلم التعزيز للحصول على أحدث نماذجها لتعلم توليد التفكير الذي يشير إلى الإجابات الصحيحة. هذا يتطلب جمع بيانات تدريب إضافية من البشر على حل مشاكل محددة.

يقول Penn أن وضع التفكير في كلود تلقى بيانات إضافية حول تطبيقات الأعمال بما في ذلك كتابة التعليمات البرمجية والتوحيد ، وذلك باستخدام أجهزة الكمبيوتر ، والإجابة على الأسئلة القانونية المعقدة. يقول بن: “الأشياء التي قمنا بإجراء تحسينات عليها هي … الموضوعات الفنية أو الموضوعات التي تتطلب التفكير الطويل”. “ما لدينا من عملائنا هو اهتمام كبير بنشر نماذجنا في أعباء العمل الفعلية.”

تقول الأنثروبور إن كلود 3.7 جيد بشكل خاص في حل مشكلات الترميز التي تتطلب التفكير خطوة بخطوة ، مما يتفوق على Openai’s O1 على بعض المعايير مثل Swe-Bench. تقوم الشركة اليوم بإصدار أداة جديدة ، تسمى Claude Code ، المصممة خصيصًا لهذا النوع من الترميز بمساعدة AI.

يقول بن: “النموذج جيد بالفعل في الترميز”. لكن “التفكير الإضافي سيكون جيدًا للحالات التي قد تتطلب تخطيطًا معقدًا للغاية – فأنت تنظر إلى قاعدة رمز كبيرة للغاية لشركة.”

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *