يتيح مشغل OpenAI لـ ChatGPT استخدام الويب نيابةً عنك


تسمح OpenAI لبعض المستخدمين بتجربة ميزة ChatGPT الجديدة التي تستخدم الذكاء الاصطناعي لتشغيل متصفح الويب لحجز الرحلات وشراء البقالة والبحث عن الصفقات والقيام بالعديد من المهام الأخرى عبر الإنترنت.

الأداة الجديدة، التي تسمى Operator، هي وكيل للذكاء الاصطناعي: فهي تعتمد على نموذج ذكاء اصطناعي تم تدريبه على كل من النصوص والصور لتفسير الأوامر ومعرفة كيفية استخدام متصفح الويب لتنفيذها. تدعي OpenAI أن لديها القدرة على أتمتة العديد من المهام اليومية ومهام يوم العمل.

يتبع مشغل OpenAI الإصدارات المنافسة من كل من Google وAnthropic، والتي أظهرت قدرة الإصدارات على استخدام الويب. يُنظر إلى وكلاء الذكاء الاصطناعي على نطاق واسع على أنهم المرحلة التطورية التالية للذكاء الاصطناعي بعد روبوتات الدردشة، وقد قفزت العديد من الشركات في قطار الضجيج من خلال الترويج لهم. في معظم الحالات، تكون قدرات هذه البرامج محدودة جدًا وتستخدم ببساطة نموذجًا لغويًا لأتمتة الأمور التي يتم إجراؤها عادةً باستخدام البرامج العادية.

يقول بيتر ويلندر، نائب رئيس المنتج في OpenAI: “يتطور الذكاء الاصطناعي من هذه الأداة التي يمكنها الإجابة على أسئلتك إلى أداة قادرة أيضًا على اتخاذ إجراءات في العالم، وتنفيذ عمليات سير عمل معقدة ومتعددة الخطوات”. “سنرى تأثيرًا كبيرًا على إنتاجية الأشخاص، ولكن أيضًا على جودة العمل الذي يستطيع الناس إنجازه.”

تعترف OpenAI بأن منح ChatGPT إمكانية الوصول إلى متصفح الويب يؤدي إلى مخاطر جديدة، وتقول إن المشغل قد يسيء التصرف في بعض الأحيان. وتقول إنها نفذت العديد من الضمانات والخطط الجديدة لتوسيع قدرات المشغل تدريجيًا.

يقول Welinder وYash Kumar، قائد الإنتاج والهندسة في وكيل استخدام الكمبيوتر في OpenAI، إن الخطة تهدف إلى التعلم من كيفية استخدام الأشخاص للأداة. ويقرون بأن الأداة يمكن أن تقوم بحجوزات أو عمليات شراء غير مرغوب فيها، لكنهم يضيفون أنه تم بذل الكثير من العمل للتأكد من أنها تسأل قبل القيام بأي شيء محفوف بالمخاطر. يقول كومار: “سوف يعود إليّ ويطلب تأكيدات قبل اتخاذ خطوات قد لا رجعة فيها”.

أصدرت OpenAI اليوم أيضًا “بطاقة نظام” جديدة توضح المشكلات التي قد تحدث مع المشغل. وتشمل هذه احتمالية إساءة فهم الأوامر أو الانحراف عما يطلبه المستخدم؛ أن يساء استخدامها من قبل المستخدمين؛ أو أن يتم استهدافها من قبل مجرمي الإنترنت.

يقول كومار: “إنها تشكل أيضًا قدرًا لا يصدق من التحديات المتعلقة بالسلامة”. “لأن منطقة ناقل الهجوم ومنطقة ناقل الخطر لديك تزيدان بشكل كبير.”

سيكون المشغل متاحًا في البداية كـ “معاينة بحثية” لمستخدمي ChatGPT الذين لديهم حساب Pro، والذي يكلف 200 دولار شهريًا. وتقول الشركة إنها تخطط لتوسيع نطاق الوصول أثناء طرح الأداة ببطء لأنها سترتكب حتماً بعض الأخطاء على طول الطريق.

في العديد من العروض التوضيحية، أظهر Operator إمكانية قيام الذكاء الاصطناعي بدور أكثر نشاطًا كمساعد الويب. تتميز الأداة بمتصفح ويب عن بعد ونافذة دردشة للتواصل مع المستخدم.

بناءً على طلب WIRED، طُلب من المشغل حجز رحلة قطار Amtrak من نيو هيفن إلى واشنطن العاصمة. ذهبت إلى الموقع الصحيح، وأدخلت المعلومات الضرورية بشكل صحيح لإظهار الجدول الزمني، ثم طلبت المزيد من التعليمات. إذا قام المستخدم بتسجيل الدخول إلى موقع شركة أمتراك، أو إلى ملف تعريف المتصفح الذي يحتوي على معلومات بطاقة الائتمان المخزنة، فسيكون المشغل قادرًا على المضي قدمًا وحجز تذكرة – على الرغم من أنه مصمم لطلب الإذن أولاً.

طلب كومار من العميل حجز طاولة في مطعم بيريتا في سان فرانسيسكو. انتقل البرنامج إلى موقع OpenTable الإلكتروني، وعثر على المطعم الصحيح وبحث عن مدى توفره قبل السؤال عما يجب فعله بعد ذلك. تقول OpenAI إنها دخلت في شراكة مع عدد من المواقع الشهيرة، بما في ذلك OpenTable، لضمان عمل المشغل عليها بسلاسة.

تعتمد الأداة الجديدة على نموذج GPT-4o AI الخاص بشركة OpenAI، والذي يمكنه التعرف على المتصفح وصفحة الويب والتحدث في النص المكتوب. تتضمن الأداة تدريبًا إضافيًا مصممًا لمساعدتها على فهم كيفية تنفيذ المهام عبر الإنترنت. ستقوم OpenAI أيضًا بإتاحة وكيل استخدام الكمبيوتر الخاص بها من خلال واجهة برمجة التطبيقات (API) الخاصة بها.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *