يقال إن كتب Google تقوم بفهرسة الأعمال السيئة المكتوبة بالذكاء الاصطناعي
بدأت خدمة Google Books، التي تقوم بفهرسة المواد المنشورة والتي أصبحت ضرورية للأكاديميين، في فهرسة الكتب منخفضة الجودة، مما قد يؤثر على كيفية إعلام أداة تتبع اللغة الخاصة بها، Ngram.
404 وسائل الإعلام تشير التقارير إلى أن Google Books تضمنت العديد من الكتب التي كان من الممكن أن يكتبها الذكاء الاصطناعي. بحث المنشور في كتب Google باستخدام المصطلح “اعتبارًا من آخر تحديث لمعلوماتي”، وهي عبارة شائعة تستخدمها برامج الدردشة الآلية مثل ChatGPT. يمكنك البحث في كتب Google عن جمل أو مصطلحات محددة، وسيقوم عادةً بإرسال أعمال مكتوبة تحتوي على تلك العبارات.
ووجدت أن معظم الكتب في الصفحات القليلة الأولى من البحث كانت أعمالًا عن الذكاء الاصطناعي، ولكن تناثرت بين تلك النتائج كتب لم تتحدث عن التكنولوجيا ويبدو أنها كتبها روبوت.
404 وسائل الإعلام قالت الكتب التي عثرت عليها، مثل كتب تريستين ماكيفر الدببة والثيران والذئاب: تداول الأسهم لعمر العشرين، بدت مثل ويكيبيديا التي تم صيدها بشباك الجر للحصول على معلومات حول الأحداث المالية وتضمنت الجملة “اعتبارًا من آخر تحديث لمعلوماتي”. لا تزال الكتب الأخرى التي تتناول موضوعات مثل تويتر تحتوي على معلومات من عام 2021، عندما حصلت بعض نماذج الذكاء الاصطناعي على بيانات التدريب آخر مرة.
تشكل كتب جوجل معظم البيانات التي تدعم عارض Ngram الخاص بها، وهو أداة بحث تتتبع كيفية تغير اللغة بمرور الوقت. يأخذ Ngram المعلومات من الأعمال المكتوبة لإظهار كيفية تطور استخدام اللغة.
قام Google Books بمسح وفهرسة الأعمال المكتوبة التي يعود تاريخها إلى القرن السادس عشر، وقام Ngram بتحديث البيانات التي يستشهد بها آخر مرة في عام 2019. على الرغم من أن Ngram ليس مثاليًا، إلا أن العديد من اللغويين والأكاديميين الآخرين يستخدمون الأداة لجمع الأبحاث.
قال جوجل 404 وسائل الإعلام أن الأعمال الأخيرة على كتب Google لا تظهر في نتائج Ngram، ولكن من الممكن أن يتم تضمينها في تحديثات البيانات المستقبلية.