أمازون تحقق في الحيرة بشأن مزاعم إساءة الاستخدام
أطلق قسم السحابة في أمازون تحقيقًا في Perplexity AI. علمت WIRED أن المشكلة تكمن فيما إذا كانت شركة البحث الناشئة بالذكاء الاصطناعي تنتهك قواعد Amazon Web Services عن طريق حذف مواقع الويب التي حاولت منعها من القيام بذلك.
وأكد متحدث باسم AWS، الذي تحدث إلى WIRED بشرط عدم ذكر اسمه، تحقيق الشركة في قضية Perplexity. وجدت مجلة WIRED سابقًا أن الشركة الناشئة – التي تحظى بدعم من صندوق عائلة جيف بيزوس، Nvidia، والتي بلغت قيمتها مؤخرًا 3 مليارات دولار – يبدو أنها تعتمد على محتوى من مواقع الويب المحذوفة التي حظرت الوصول إليها من خلال بروتوكول استبعاد الروبوتات، وهو معيار ويب مشترك. . على الرغم من أن بروتوكول استبعاد الروبوتات ليس ملزمًا قانونًا، إلا أن شروط الخدمة تكون ملزمة بشكل عام.
بروتوكول استبعاد الروبوتات هو معيار ويب عمره عقود من الزمن يتضمن وضع ملف نص عادي (مثل wired.com/robots.txt) على مجال للإشارة إلى الصفحات التي لا ينبغي الوصول إليها بواسطة برامج الروبوت وبرامج الزحف الآلية. في حين أن الشركات التي تستخدم الكاشطات يمكنها اختيار تجاهل هذا البروتوكول، إلا أن معظمها احترمته تقليديًا. صرح المتحدث باسم أمازون لـ WIRED أنه يجب على عملاء AWS الالتزام بمعيار robots.txt أثناء الزحف إلى مواقع الويب.
وقال المتحدث في بيان: “تمنع شروط خدمة AWS العملاء من استخدام خدماتنا في أي نشاط غير قانوني، ويتحمل عملاؤنا مسؤولية الامتثال لشروطنا وجميع القوانين المعمول بها”.
يأتي التدقيق في ممارسات Perplexity في أعقاب تقرير صدر في 11 يونيو من مجلة Forbes اتهم الشركة الناشئة بسرقة مقال واحد على الأقل من مقالاتها. أكدت تحقيقات WIRED هذه الممارسة ووجدت أدلة إضافية على إزالة إساءة الاستخدام والسرقة الأدبية من خلال أنظمة مرتبطة ببرنامج الدردشة الآلي الذي يعمل بالذكاء الاصطناعي الخاص بشركة Perplexity. قام مهندسو شركة Condé Nast، الشركة الأم لـ WIRED، بحظر زاحف Perplexity عبر جميع مواقعها الإلكترونية باستخدام ملف robots.txt. لكن WIRED وجدت أن الشركة تمكنت من الوصول إلى خادم باستخدام عنوان IP غير منشور – 44.221.181.252 – والذي زار عقارات Condé Nast مئات المرات على الأقل في الأشهر الثلاثة الماضية، على ما يبدو لحذف مواقع Condé Nast الإلكترونية.
يبدو أن الجهاز المرتبط بـ Perplexity منخرط في عملية زحف واسعة النطاق لمواقع الأخبار التي تمنع الروبوتات من الوصول إلى محتواها. ويقول المتحدثون الرسميون باسم The Guardian وForbes وThe New York Times أيضًا إنهم اكتشفوا عنوان IP على خوادمها عدة مرات.
قامت WIRED بتتبع عنوان IP إلى جهاز افتراضي يُعرف باسم مثيل Elastic Compute Cloud (EC2) المستضاف على AWS، والذي بدأ تحقيقه بعد أن سألنا ما إذا كان استخدام البنية التحتية لـ AWS لحذف مواقع الويب التي تمنعها من انتهاك شروط خدمة الشركة.
في الأسبوع الماضي، رد أرافيند سرينيفاس، الرئيس التنفيذي لشركة Perplexity، على تحقيق WIRED أولاً بالقول إن الأسئلة التي طرحناها على الشركة “تعكس سوء فهم عميق وجوهري لكيفية عمل Perplexity والإنترنت”. بعد ذلك، أخبر سرينيفاس شركة Fast Company أن عنوان IP السري الذي رصدته WIRED كان يحذف مواقع Condé Nast وأن موقع الاختبار الذي أنشأناه تم تشغيله من قبل شركة خارجية تؤدي خدمات الزحف على الويب وفهرستها. ورفض تسمية الشركة مستشهدا باتفاقية عدم الإفشاء. وعندما سُئل عما إذا كان سيطلب من الطرف الثالث التوقف عن الزحف إلى WIRED، أجاب سرينيفاس “الأمر معقد”.