سرقة الذكاء الاصطناعي الكبرى من Perplexity – The Verge
في كل دورة من الضجيج، تظهر أنماط معينة من الخداع. في طفرة العملات المشفرة الأخيرة، كان الأمر يتعلق بـ “اقتصاديات البونزين” و”البساطة”. وفي السيارات ذاتية القيادة، كان الأمر “على بعد خمس سنوات فقط!” في الذكاء الاصطناعي، نرى مقدار الأشياء غير الأخلاقية التي يمكنك الإفلات منها.
الحيرة هي في الأساس وسيط يبحث عن الريع على مصادر عالية الجودة
تحاول شركة Perplexity، التي تجري محادثات مستمرة لجمع مئات الملايين من الدولارات، إنشاء منافس لبحث Google. لا تحاول شركة Perplexity إنشاء “محرك بحث”، ولكنها تريد إنشاء “محرك إجابات”. الفكرة هي أنه بدلاً من البحث في مجموعة من النتائج للإجابة على سؤالك باستخدام مصدر أساسي، ستحصل ببساطة على إجابة وجدتها لك شركة Perplexity. وقال أرافيند سرينيفاس، الرئيس التنفيذي لشركة Perplexity: “إن الصدق والدقة هما ما نهتم به”. الحافة.
وهذا يعني أن شركة Perplexity هي في الأساس وسيط يبحث عن الريع في المصادر عالية الجودة. كانت القيمة المقترحة للبحث، في الأصل، هي أنه من خلال حذف العمل الذي قام به الصحفيون وغيرهم، أرسلت نتائج جوجل حركة المرور إلى تلك المصادر. ولكن من خلال توفير إجابة، بدلاً من توجيه الأشخاص للنقر للوصول إلى مصدر أساسي، فإن ما يسمى بـ “محركات الإجابات” تحرم المصدر الرئيسي لعائدات الإعلانات – مع الاحتفاظ بهذه الإيرادات لأنفسهم. تعد Perplexity من بين مجموعة من مصاصي الدماء تشمل Arc Search وGoogle نفسها.
لكن شركة Perplexity خطت خطوة أخرى إلى الأمام من خلال منتج الصفحات الخاص بها، والذي يقوم بإنشاء “تقرير” ملخص بناءً على تلك المصادر الأولية. لا يقتصر الأمر على اقتباس جملة أو اثنتين للإجابة مباشرة على سؤال المستخدم – بل هو إنشاء مقالة مجمعة بالكامل، وهو دقيق بمعنى أنه ينتحل بشكل نشط المصادر التي يستخدمها.
فوربس اكتشف أن شركة Perplexity كانت تتهرب من نظام حظر الاشتراك غير المدفوع للنشر من أجل تقديم ملخص للتحقيق الذي أجراه المنشور بشأن شركة الطائرات بدون طيار التابعة للرئيس التنفيذي السابق لشركة Google إريك شميدت. رغم ذلك فوربس لديها نظام حظر الاشتراك غير المدفوع على بعض أعمالها، فإن العمل المتميز – مثل هذا التحقيق – يقع خلف نظام حظر الاشتراك غير المدفوع الصارم. لم يقتصر الأمر على أن شركة Perplexity تهربت بطريقة ما من نظام حظر الاشتراك غير المدفوع فحسب، بل إنها بالكاد استشهدت بالتحقيق الأصلي و استحوذت على الفن الأصلي لاستخدامه في تقريرها. (بالنسبة لأولئك الذين يتابعون أعمالهم في المنزل، فإن الفن هو انتهاك لحقوق الطبع والنشر.)
“شخص آخر فعل ذلك” هي حجة جيدة لطفل يبلغ من العمر خمس سنوات
التجميع ليس ظاهرة جديدة بشكل خاص – ولكن النطاق الذي يمكن أن تتجمع به الحيرة، إلى جانب انتهاك حقوق الطبع والنشر لاستخدام الفن الأصلي، رائع جدًا، لافت للنظر. وفي محاولة لتهدئة الجميع، ذهب كبير مسؤولي الأعمال في الشركة إلى سيمافور لنقول إن شركة Perplexity كانت تعمل على تطوير خطط لتقاسم الإيرادات مع المنشورات، ويا للعجب، كيف كان حال الجميع يعني ذلك لمنتج لا يزال في التنمية؟
عند هذه النقطة، سلكي قفزت لتأكيد النتيجة التي توصل إليها روب نايت: تجريف الحيرة فوربس العمل لم يكن استثناء. في الواقع، تتجاهل شركة Perplexity كود ملف robots.txt الذي يطلب صراحةً من برامج زحف الويب عدم خدش الصفحة. رد سرينيفاس شركة سريعة الذي – التي في الحقيقةالحيرة لم تكن تتجاهل ملف robots.txt؛ لقد كانت مجرد استخدام كاشطات خارجية تجاهلتها. رفض سرينيفاس تسمية أداة استخراج البيانات التابعة لجهة خارجية ولم يلتزم بمطالبة هذا الزاحف بالتوقف عن انتهاك ملف robots.txt.
“شخص آخر فعل ذلك” هي حجة جيدة لطفل يبلغ من العمر خمس سنوات. وفكر في الرد أكثر. إذا أراد سرينيفاس أن يكون أخلاقيا، كان لديه بعض الخيارات هنا. الخيار الأول هو إنهاء العقد مع مكشطة الطرف الثالث. الخيار الثاني هو محاولة إقناع أداة استخراج الملفات باحترام ملف robots.txt. لم يلتزم سرينيفاس بأي منهما، ويبدو لي أن هناك سببًا واضحًا وراء ذلك. حتى لو كانت شركة Perplexity نفسها لا تنتهك الكود، فإنها تعتمد على شخص آخر ينتهك الكود حتى يعمل “محرك الإجابات” الخاص بها.
ومما زاد الطين بلة أن الحيرة مسروقة سلكيمقالة حول هذا الموضوع – على الرغم من ذلك سلكي يحظر الحيرة بشكل صريح في ملفها النصي. الجزء الأكبر من سلكي‘س تتناول المقالة المتعلقة بالسرقة الفكرية سبل الانتصاف القانونية، ولكنني مهتم بمعرفة ما يحدث هنا مع ملف robots.txt. إنها اتفاقية حسن النية التي صمدت لعقود من الزمن، وهي تنهار بفضل شركات الذكاء الاصطناعي عديمة الضمير – هذا صحيح، شركة Perplexity ليست الوحيدة – التي تقوم بتحريك أي شيء متاح تقريبًا من أجل تدريب نماذجها الهراء. وتذكر كيف قال سرينيفاس إنه ملتزم بـ “الحقيقة”؟ ولست متأكدًا من صحة هذا أيضًا: فالحيرة تظهر الآن النتائج التي تم إنشاؤها بواسطة الذكاء الاصطناعي والمعلومات الخاطئة الفعلية. فوربس التقارير.
في أذني، كان سرينيفاس يتفاخر بمدى سحر وذكاء كذبته
لقد رأينا الكثير من عمالقة الذكاء الاصطناعي ينخرطون في ممارسات قانونية مشكوك فيها ويمكن القول إنها غير أخلاقية من أجل الحصول على البيانات التي يريدونها. من أجل إثبات قيمة الحيرة للمستثمرين، قام سرينيفاس ببناء أداة لاختراق تويتر من خلال التظاهر بأنه باحث أكاديمي يستخدم الوصول إلى واجهة برمجة التطبيقات (API) للبحث. “سأتصل بي [fake academic] قال سرينيفاس لليكس فريدمان في البودكاست الخاص بالأخير: “مشاريع مثل برين رانك وكل هذه الأنواع من الأشياء”. أفترض أن “Brin Rank” هي إشارة إلى المؤسس المشارك لشركة Google سيرجي برين؛ في أذني، كان سرينيفاس يتفاخر بمدى سحر وذكاء كذبته.
أنا لست الشخص الذي يخبرك أن أساس الحيرة هو الكذب لتفادي المبادئ الراسخة التي تعيق الويب. الرئيس التنفيذي لها هو. وهذا يوضح القيمة الفعلية المقترحة لـ “محركات الإجابات”. لا تستطيع شركة Perplexity توليد معلومات فعلية من تلقاء نفسها وتعتمد بدلاً من ذلك على أطراف ثالثة تسيء استخدام سياساتها. تم تطوير “محرك الإجابات” من قبل أشخاص لا يترددون في الكذب عندما يكون ذلك أكثر ملاءمة لهم، وهذا التفضيل ضروري لكيفية عمل الحيرة.
إذن هذا هو الابتكار الحقيقي لـPerplexity هنا: تحطيم أسس الثقة التي بنت الإنترنت. والسؤال هو ما إذا كان أي من مستخدميها أو المستثمرين يهتمون بها.
تصحيح 27 يونيو: يزيل الإشارة الخاطئة إلى Axios – المقابلة المعنية كانت مع Semafor.