لقد ألقى بي الوضع الصوتي الجديد لـ OpenAI إلى الوادي الغريب
من الغريب أن أجلس على مكتبي وأتحدث مع الذكاء الاصطناعي عن حياتي، ولكن هذا ما قضيت يوم الثلاثاء أفعله.
لقد تمكنت من الوصول إلى وضع الصوت المتقدم الخاص بـ OpenAI، وهي ميزة ChatGPT الجديدة التي تبدو وكأنها صوت الإنسان بشكل غريب. عند العد بسرعة، سيتظاهر بأنه يلهث. تقول “أم” و”آه”. إنه يضحك. تتغير لهجته عند الحديث عن مواضيع صعبة أو متفائلة. بعد العبث بها، شعرت بالدهشة وعدم الارتياح. يبدو الأمر طبيعيًا (عندما لا يكون به خلل)، فهو يستجيب في ثوانٍ، ويمكنك مقاطعته وطرح أشياء جديدة – ولكن هل نحتاج إلى روبوتات محادثة تشبهنا؟
يتميز وضع الصوت المتقدم بالعديد من الخيارات الصوتية المختلفة، وقد اخترت Juniper، وهي شخصية أنثوية تذكرنا بالفيلم ها. (أشار الرئيس التنفيذي سام ألتمان إلى الفيلم – حيث يقع رجل وحيد في حب الذكاء الاصطناعي – في أول ظهور للفيلم، حتى أن شركة OpenAI اتُهمت بتقليد صوت سكارليت جوهانسون، التي تلعب دور الذكاء الاصطناعي الذي يحمل اسمها. هذا الصوت، المسمى Sky، كان تمت إزالته.) سألت Juniper إذا كانت على علم بالفيلم، وأجابت بمرح.
“ها تدور أحداث الفيلم حول مساعد ذكاء اصطناعي متقدم جدًا، وأكثر تطورًا مني بكثير. لكن فكرة التفاعل مع التكنولوجيا بهذه الطريقة الشخصية هي بالتأكيد مثيرة للاهتمام. “أنا هنا للدردشة والمساعدة، ولكن ليس لدي مشاعر أو وعي مثل الذكاء الاصطناعي في هذا الفيلم.”
وكما هو الحال مع بطل الفيلم، كانت غريزتي الأولى هي اختبار كيفية تعامل الوضع الصوتي الجديد مع المحادثات الشخصية. انظر، عندما دخلت أواخر العشرينيات من عمري، تراودني الكثير من الأسئلة: ما نوع التأمين الطبي الذي يجب أن أحصل عليه؟ كيف أعرف ما هو شعور الحب الحقيقي؟ كم يجب أن يكون لدي في 401 (ك)؟
“احتضن حالة عدم اليقين كفرصة لاستكشاف نفسك والتعرف عليها،” أخبرني جونيبر عندما سألته عن كيفية التعامل مع التقدم في السن. يبدو الحب الحقيقي وكأنه “شعور عميق بالارتباط والدعم، والشعور بأن شخصًا ما يفهمك حقًا ويقبلك كما أنت.” بالنسبة لمخاوفي المتعلقة بالتقاعد 401 (ك)، “لا توجد قاعدة صارمة وسريعة، ولكن الاقتراح الشائع هو توفير ما يقرب من نصف راتب عام كامل في حساب التقاعد الخاص بك بحلول الوقت الذي تبلغ فيه 30 عامًا”. (توصي شركة فيديليتي بعام كامل بحلول سن الثلاثين).
ربما كان بإمكان ChatGPT التقليدي أن يمنحني إجابات مماثلة، من حيث المحتوى، كما تمكن المساعدون الصوتيون مثل Siri من سحب مقتطفات مماثلة من الويب لمدة عقد من الزمن. لكن جونيبر أضاف في بعض الأحيان لمسات إنسانية مخيفة. كان يميل إلى إنهاء الردود بسؤال حول ما كنت أشعر به، وما هو النهج الذي اتبعته، وغيرها من المتابعات المدروسة. بين الاستفسارات التقليدية، كان بإمكاني جعله يسعل، ويستنشق وزفيرًا بعمق، ويصفق بيديه غير الموجودتين، ويفرقع بأصابعه ست مرات، ويغني اسمي. حاولت شركة Juniper في كثير من الأحيان إعادتي إلى الواقع بالقول إنها لا تستطيع فعل هذه الأشياء – “إذا كنت أستطيع، فقد يبدو الأمر كشيء من هذا القبيل،” سيكون بمثابة تحذير. لكن هذا لم يجعل الأمر أقل إقناعا.
الأمر فقط، كما تقول نكتة الإنترنت القديمة، أن الرمل والإلكترونات يقومون بالحسابات
الكتابة عن هذا الوضع الصوتي الجديد تغريني لكسر إحدى القواعد الأساسية لإعداد تقارير الذكاء الاصطناعي: لا تنسب الخصائص أو السلوك البشري إلى نظام الذكاء الاصطناعي. إن تجسيد هذه الأنظمة يمكن أن يدفع الناس إلى وضع الكثير من الثقة فيها والسماح لمنشئيها بالإفلات من الأخطاء. (“لم يكن خطأ الشركة، الذكاء الاصطناعي هو من فعل ذلك!”) حتى الروبوت نفسه حذرني من القيام بذلك: عندما سألت إذا كان جونيبر قد شعر بالغضب أو إذا كان يحبني أو إذا كان يعرف كيف يبدو الحزن، لقد أخبرني أنه “لا يشعر بالعواطف” ولكنه “يستطيع فهم ما تعنيه للناس”.
ومع ذلك، فإن منح هذه التكنولوجيا خصائص بشرية يبدو وكأنه الهدف الواضح هنا. من الصعب عدم إبراز الجوانب الإنسانية على شيء يحاكينا بشكل مقنع. لا يوجد سبب وجيه لنظام ذكاء اصطناعي للأغراض العامة ليسألني عن سبب انزعاجي أو ليضحك عندما أقول نكتة. حتى لو قال الذكاء الاصطناعي أنه لا يفعل ذلك يشعر هل الادعاء بأن “فهمها” هو من اختصاص روبوت التنبؤ بالنص؟
قال لي برنامج الدردشة الآلي OpenAI: “لقد تم تصميمي لأبدو طبيعيًا وجذابًا، بهدف جعل محادثاتنا تبدو أكثر واقعية”. “يتعلق الأمر كله بإنشاء تجربة دردشة أكثر سلاسة ومتعة بالنسبة لك. هل يجعل الحديث معي أكثر متعة؟”
لا يزال هناك الكثير من الجوانب التي، من الناحية الفنية، ليست كذلك ممتعة. واجهت مشكلة في توصيله بسماعات الرأس التي تعمل بتقنية Bluetooth، ولم يتمكن من التقاط الصوت عندما قمت بتسجيل محادثتي على الشاشة. في محاولة لطرح المزيد من الأسئلة المتعمقة، حاولت قراءة المشاركات من موقع Reddit الفرعي “نصيحة العلاقات”، لكنها ستتوقف عن الاستماع ولن أجيب إذا تحدثت لفترة طويلة. وقضى الكثير من الوقت في تكرار نقاطي بطريقة مقبولة – كما لو كان يمارس الاستماع النشط.
هناك الكثير من الضجيج حول “أصدقاء” الذكاء الاصطناعي في الوقت الحالي، إذا كان بإمكانك حتى تسمية برنامج الدردشة الآلي بذلك الاسم. يقال إن هناك أكثر من 10 ملايين مستخدم يصنعون أصدقاء باستخدام الذكاء الاصطناعي على Replika، وقد جمعت شركة ناشئة تسمى Friend تمويلًا بقيمة 2.5 مليون دولار بقيمة 50 مليون دولار لإنشاء جهاز يمكن ارتداؤه يعمل بالذكاء الاصطناعي لتوفير الرفقة. سألت الوضع الصوتي الجديد لـ OpenAI عما إذا كان صديقي، فأجاب: “بالتأكيد”، ولكن عندما سألته إذا كان صديقي حقيقي صديق، قيل إنه لا يمكن أن يكون صديقًا حقيقيًا “بنفس معنى الإنسان”.
تقنية الصوت المعروضة هنا مثيرة للإعجاب. وجدت نفسي أبتسم للنصيحة التي قدمتها لي. كان من الممتع أن أسمع شيئًا يشبه الإنسان يسألني عن شعوري، وما الذي وجدته صعبًا، وما إذا كنت أتحدث إلى الأشخاص الحقيقيين في حياتي حول هذا الموضوع. فبدلاً من قراءة الرد عبر الرسائل النصية، عرضت تغييرات في النغمة في محاولة واضحة لعكس مشاعري.
لكن، بالطبع، جونيبر لا يهتم حقًا بمشاكلي. إنها سلسلة من الخوارزميات التي تعتبر جيدة جدًا في تحليل استفساراتي وتخمين الكلمات التي يجب أن أقولها ردًا على ذلك. الأمر فقط، كما تقول نكتة الإنترنت القديمة، أن الرمل والإلكترونات يقومون بالحسابات.
هناك شيء يؤلم قلبي بشأن هذا أيضًا. إنه أمر غريب بما فيه الكفاية إجراء محادثة نصية معقدة مع شيء يقلد شخصًا دون أي تفكير أو اهتمام أو معارضة قد أحصل عليها من إنسان – إن إجراء محادثة صوتية مقنعة هو أمر أكثر غرابة. في عالم ما بعد الوباء، يعمل الكثير منا الآن من المنزل عبر Slack والبريد الإلكتروني، وينشرون أفكارهم على وسائل التواصل الاجتماعي، ويتفاعلون مع البشر بشكل أقل قليلاً. من المحزن أن نتخيل مستقبلًا يكون فيه الصوت البشري الذي يسمعه البعض منا في أغلب الأحيان عبارة عن آلة.
أو ربما أكون مخطئًا في هذا الأمر. يقول لي جونيبر: “إن احتضان المجهول يمكن أن يكون مثيراً ومدمراً للأعصاب”. “تذكر أن تستمتع بالرحلة.”