OpenAI تعبث بمنتدى الأبوة والأمومة الخاطئ ذو الشعبية الكبيرة
فكر في أي موضوع يمكن تخيله يتعلق بشكل غامض بتربية الأطفال، ومن المحتمل أن يكون هناك منشور حول هذا الموضوع على Mumsnet، وهو منتدى الأبوة والأمومة للأمهات القائم منذ فترة طويلة، والذي يتمتع بشعبية كبيرة، ويثير الجدل، ومقره في المملكة المتحدة. على مدار تاريخها الممتد لأكثر من عقدين من الزمن، جمعت Mumsnet أرشيفًا يضم أكثر من ستة مليارات كلمة كتبها قاعدة مستخدميها المتفاعلين للغاية، حول موضوعات مثل الحفاضات المتسخة والأزواج الكسالى. (ناهيك عن الحديث المجنون عن الدلافين).
في ربيع هذا العام، بعد أن اكتشفت Mumsnet أن شركات الذكاء الاصطناعي كانت تقوم بجمع بياناتها، قالت الشركة إنها قررت محاولة إبرام صفقات ترخيص مع بعض اللاعبين الرئيسيين في هذا المجال، بما في ذلك OpenAI، التي أعربت في البداية عن استعدادها لاستكشاف ترتيب بعد أن توصلت Mumsnet لأول مرة خارج. وبعد انهيار المحادثات مع OpenAI، أعلنت Mumsnet في يوليو/تموز عن نيتها اتخاذ إجراءات قانونية.
وفقًا لـ Mumsnet، خلال تلك المحادثات المبكرة، أخبر أحد قادة الشراكة الإستراتيجية في OpenAI الشركة أن مجموعات البيانات التي تزيد عن مليار كلمة كانت محل اهتمام عملاق الذكاء الاصطناعي. كانت قيادة Mumsnet متحمسة. “لقد أمضينا بعض الوقت في التواصل معهم”، تقول جوستين روبرتس، المؤسس والرئيس التنفيذي لشركة Mumsnet، لـ WIRED. “كان علينا التوقيع على بعض اتفاقيات عدم الإفشاء، وكانوا يريدون الكثير من المعلومات منا”.
ومع ذلك، بعد أكثر من شهر، أخبرت OpenAI Mumsnet أن الشركة لم تعد مهتمة بالشراكة في ذلك الوقت، وفقًا لتبادل البريد الإلكتروني الذي استعرضته WIRED. عندما سُئل عن السبب، وصف موظف OpenAI مجموعة بيانات Mumsnet المكونة من 6 مليارات كلمة بأنها صغيرة جدًا بحيث لا تضمن ترتيبات الترخيص، كما يقول روبرتس. وأشاروا أيضًا إلى أن OpenAI مهتمة في المقام الأول بمجموعات البيانات الكبيرة التي لا يستطيع الجمهور الوصول إليها بالفعل عبر الإنترنت، وأنها تريد مجموعات بيانات تستحوذ على خبرة إنسانية واسعة النطاق.
وقد رددت الشركة هذا الشعور عندما طلبت منها WIRED التعليق. تقول كايلا وود، المتحدثة باسم OpenAI: “إننا نسعى إلى إقامة شراكات من أجل مجموعات بيانات واسعة النطاق تعكس المجتمع البشري، ولا نسعى إلى إقامة شراكات من أجل المعلومات المتاحة للجمهور فقط”. “نحن ندعم اختيار الناشرين والمبدعين، ونقدم لهم طرقًا للتعبير عن تفضيلاتهم حول كيفية عمل مواقعهم ومحتواهم مع الذكاء الاصطناعي في نتائج البحث وتدريب النماذج الأساسية للذكاء الاصطناعي.”
وتقول روبرتس إنها “منزعجة” من هذا التطور. وتتذكر أن OpenAI في البداية بدت مهتمة بشكل خاص بـ Mumsnet بسبب محتوى المنصة الذي تكتبه النساء بشكل كبير. وتقول: “إنها بيانات محادثة عالية الجودة”. “إنها محادثة نسائية بنسبة 90 بالمائة، وهو أمر غير معتاد على الإطلاق.”
أبرمت OpenAI مجموعة متنوعة من صفقات ترخيص البيانات مع وسائل الإعلام والمنصات في العام الماضي، ودخلت في اتفاقيات مع Vox Media، الأطلسيو Axel Springer و Time والشركة الأم WIRED Condé Nast، بالإضافة إلى منصات مليئة بالمحتوى الذي ينشئه المستخدمون مثل Reddit. (قيل أيضًا إن شركة Automattic، مالكة WordPress.com وTumblr، تجري محادثات ترخيص في وقت سابق من هذا العام.) وبما أن تفاصيل تلك الصفقات لم يتم الكشف عنها، فليس من الواضح ما هو حجم مجموعاتها الخاصة.
عندما سألت WIRED عن حجم مجموعات البيانات التي ستأخذها في الاعتبار للترخيص التجاري، رفضت OpenAI مشاركة تلك المعلومات. لكن المتحدثة باسم كايلا وود تؤكد أن شراكات الشركة مع الناشرين “تركز على عرض محتواهم في منتجاتنا وجذب الزيارات إليها”.