أدى بيع Reddit لبيانات المستخدم للتدريب على الذكاء الاصطناعي إلى تحقيق لجنة التجارة الفيدرالية (FTC).
قال رديت قدما من المتوقع أن يحقق الاكتتاب العام الأولي الأسبوع المقبل أن ترخيص منشورات المستخدمين إلى Google وغيرها لمشاريع الذكاء الاصطناعي يمكن أن يحقق إيرادات بقيمة 203 ملايين دولار على مدى السنوات القليلة المقبلة. اضطرت المنصة التي يقودها المجتمع إلى الكشف يوم الجمعة أن المنظمين الأمريكيين لديهم بالفعل أسئلة حول هذا الخط الجديد من الأعمال.
في ملف تنظيمي، قالت Reddit إنها تلقت خطابًا من لجنة التجارة الفيدرالية الأمريكية يوم الخميس تسأل عن “بيعنا أو ترخيصنا أو مشاركتنا للمحتوى الذي ينشئه المستخدمون مع أطراف ثالثة لتدريب نماذج الذكاء الاصطناعي”.
تتمتع لجنة التجارة الفيدرالية (FTC)، وهي الهيئة التنظيمية الرئيسية لمكافحة الاحتكار التابعة للحكومة الأمريكية، بسلطة فرض عقوبات على الشركات التي يتبين أنها تشارك في ممارسات تجارية غير عادلة أو خادعة. أثارت فكرة ترخيص المحتوى الذي ينشئه المستخدمون لمشاريع الذكاء الاصطناعي تساؤلات من المشرعين وجماعات حقوق الإنسان حول مخاطر الخصوصية والعدالة وحقوق النشر.
Reddit ليس الوحيد الذي يحاول جني الأموال من بيانات الترخيص، بما في ذلك البيانات التي أنشأها المستخدمون للذكاء الاصطناعي. وقع موقع الأسئلة والأجوبة البرمجية Stack Overflow اتفاقًا مع Google، ووقعت وكالة Associated Press اتفاقًا مع OpenAI، وقال مالك Tumblr Automattic إنه يعمل “مع شركات مختارة في مجال الذكاء الاصطناعي” لكنه سيسمح للمستخدمين بإلغاء الاشتراك في نقل بياناتهم. . لم يستجب أي من المرخصين على الفور لطلبات التعليق. كما أن Reddit ليست الشركة الوحيدة التي تتلقى خطاب لجنة التجارة الفيدرالية بشأن ترخيص البيانات، حسبما أفاد موقع Axios يوم الجمعة نقلاً عن مسؤول سابق في الوكالة لم يذكر اسمه.
من غير الواضح ما إذا كانت الرسالة الموجهة إلى Reddit مرتبطة بشكل مباشر بالمراجعة في أي شركات أخرى.
وقالت Reddit في الكشف الذي صدر يوم الجمعة إنها لا تعتقد أنها شاركت في أي ممارسات غير عادلة أو خادعة، لكنها حذرت من أن التعامل مع أي تحقيق حكومي يمكن أن يكون مكلفًا ويستغرق وقتًا طويلاً. يقول الملف: “أشارت الرسالة إلى أن موظفي لجنة التجارة الفيدرالية كانوا مهتمين بالاجتماع معنا لمعرفة المزيد حول خططنا وأن لجنة التجارة الفيدرالية تعتزم طلب معلومات ومستندات منا مع استمرار تحقيقها”. وقال موقع Reddit إن خطاب لجنة التجارة الفيدرالية وصف التدقيق بأنه مرتبط بـ “تحقيق غير عام”.
أعلن موقع Reddit، الذي يعتبر خبراء الذكاء الاصطناعي منشوراته وتعليقاته البالغ عددها 17 مليارًا، ذات قيمة لتدريب روبوتات الدردشة على فن المحادثة، عن صفقة الشهر الماضي لترخيص المحتوى لشركة Google. لم يستجب Reddit وGoogle على الفور لطلبات التعليق. ورفضت لجنة التجارة الفيدرالية التعليق.
يُنظر إلى روبوتات الدردشة المدعمة بالذكاء الاصطناعي مثل ChatGPT من OpenAI وGemini من Google على أنها تشكل تهديدًا تنافسيًا لـ Reddit والناشرين وغيرها من الشركات التي تدعم الإعلانات والتي تعتمد على المحتوى. في العام الماضي، ظهر احتمال ترخيص البيانات لمطوري الذكاء الاصطناعي باعتباره جانبًا إيجابيًا محتملاً للذكاء الاصطناعي التوليدي لبعض الشركات.
لكن استخدام البيانات التي تم جمعها عبر الإنترنت لتدريب نماذج الذكاء الاصطناعي أثار عددا من الأسئلة التي تدور في قاعات مجالس الإدارة، وقاعات المحاكم، والكونغرس. بالنسبة إلى Reddit والآخرين الذين يتم إنشاء بياناتهم بواسطة المستخدمين، تتضمن هذه الأسئلة من يملك المحتوى حقًا وما إذا كان من العدل ترخيصه دون منح المنشئ حصة. وجد الباحثون الأمنيون أن نماذج الذكاء الاصطناعي يمكنها تسريب البيانات الشخصية المضمنة في المواد المستخدمة في إنشائها. وأشار بعض النقاد إلى أن الصفقات يمكن أن تجعل الشركات القوية أكثر هيمنة.