يجب أن يكشف الذكاء الاصطناعي مفتوح المصدر عن بيانات التدريب الخاصة به، وفقًا لتعريف OSI الجديد


أصدرت مبادرة المصدر المفتوح (OSI) تعريفها الرسمي للذكاء الاصطناعي “المفتوح”، مما يمهد الطريق للصراع مع عمالقة التكنولوجيا مثل ميتا – الذين لا تتوافق نماذجهم مع القواعد.

لقد وضعت OSI منذ فترة طويلة معايير الصناعة لما يشكل برمجيات مفتوحة المصدر، ولكن أنظمة الذكاء الاصطناعي تتضمن عناصر لا تغطيها التراخيص التقليدية، مثل بيانات التدريب النموذجية. الآن، لكي يُعتبر نظام الذكاء الاصطناعي مفتوح المصدر حقًا، يجب أن يوفر ما يلي:

  • الوصول إلى تفاصيل حول البيانات المستخدمة لتدريب الذكاء الاصطناعي حتى يتمكن الآخرون من فهمها وإعادة إنشائها
  • الكود الكامل المستخدم لبناء وتشغيل الذكاء الاصطناعي
  • الإعدادات والأوزان من التدريب، والتي تساعد الذكاء الاصطناعي على تحقيق نتائجه

يتحدى هذا التعريف بشكل مباشر نموذج Meta’s Llama، الذي يتم الترويج له على نطاق واسع باعتباره أكبر نموذج مفتوح المصدر للذكاء الاصطناعي. Llama متاحة للعامة للتنزيل والاستخدام، ولكن لديها قيود على الاستخدام التجاري (للتطبيقات التي تضم أكثر من 700 مليون مستخدم) ولا توفر إمكانية الوصول إلى بيانات التدريب، مما يجعلها أقل من معايير OSI للحرية غير المقيدة في الاستخدام والتعديل والاستخدام. ومشاركة.

وقال المتحدث باسم ميتا فيث آيشن الحافة وأنه بينما “نحن نتفق مع شريكنا OSI في العديد من الأشياء”، فإن الشركة لا توافق على هذا التعريف. “لا يوجد تعريف واحد للذكاء الاصطناعي مفتوح المصدر، ويمثل تعريفه تحديًا لأن التعريفات السابقة مفتوحة المصدر لا تشمل تعقيدات نماذج الذكاء الاصطناعي سريعة التقدم اليوم.”

وأضاف آيشن: “سنواصل العمل مع OSI ومجموعات الصناعة الأخرى لجعل الذكاء الاصطناعي أكثر سهولة ومجانية بشكل مسؤول، بغض النظر عن التعريفات التقنية”.

على مدار 25 عامًا، ظل تعريف OSI للبرمجيات مفتوحة المصدر مقبولًا على نطاق واسع من قبل المطورين الذين يرغبون في البناء على عمل بعضهم البعض دون خوف من الدعاوى القضائية أو فخاخ الترخيص. والآن، بينما يعيد الذكاء الاصطناعي تشكيل المشهد، يواجه عمالقة التكنولوجيا خيارا محوريا: إما تبني هذه المبادئ الراسخة أو رفضها. كما قامت مؤسسة Linux مؤخرًا بمحاولة لتعريف “الذكاء الاصطناعي مفتوح المصدر”، مما يشير إلى نقاش متزايد حول كيفية تكيف القيم التقليدية مفتوحة المصدر مع عصر الذكاء الاصطناعي.

“الآن بعد أن أصبح لدينا تعريف قوي، ربما يمكننا الرد بقوة أكبر ضد الشركات التي تتبنى “الغسل المفتوح” وتعلن أن أعمالها مفتوحة المصدر في حين أنها ليست كذلك في الواقع،” سيمون ويليسون، باحث مستقل ومبتكر البرمجيات المفتوحة المصدر. -قال مصدر مجموعة بيانات متعددة الأدوات الحافة.

وصف كليمنت ديلانج، الرئيس التنفيذي لشركة Hugging Face، تعريف OSI بأنه “مساعدة كبيرة في تشكيل المحادثة حول الانفتاح في الذكاء الاصطناعي، خاصة عندما يتعلق الأمر بالدور الحاسم لبيانات التدريب”.

يقول ستيفانو مافولي، المدير التنفيذي لـ OSI، إن الأمر استغرق عامين، واستشارة الخبراء على مستوى العالم، لتحسين هذا التعريف من خلال عملية تعاونية. وتضمن ذلك العمل مع خبراء من الأوساط الأكاديمية في مجال التعلم الآلي ومعالجة اللغات الطبيعية، والفلاسفة، ومنشئي المحتوى من عالم المشاع الإبداعي، والمزيد.

في حين تستشهد شركة ميتا بمخاوف تتعلق بالسلامة لتقييد الوصول إلى بيانات التدريب الخاصة بها، يرى النقاد دافعًا أبسط: تقليل مسؤوليتها القانونية وحماية ميزتها التنافسية. يكاد يكون من المؤكد أن العديد من نماذج الذكاء الاصطناعي مدربة على المواد المحمية بحقوق الطبع والنشر؛ في أبريل، نيويورك تايمز ذكرت أن Meta اعترفت داخليًا بوجود محتوى محمي بحقوق الطبع والنشر في بيانات التدريب الخاصة بها “لأنه ليس لدينا طريقة لعدم جمع ذلك”. هناك سلسلة من الدعاوى القضائية ضد Meta وOpenAI وPerplexity وAnthropic وغيرها بسبب الانتهاك المزعوم. ولكن مع استثناءات نادرة – مثل شركة Stable Diffusion، التي تكشف عن بيانات التدريب الخاصة بها – يجب على المدعين حاليًا الاعتماد على أدلة ظرفية لإثبات أن عملهم قد تم إلغاؤه.

وفي الوقت نفسه، يرى مافولي أن تاريخ المصادر المفتوحة يعيد نفسه. وقال مافولي: “إن ميتا تقدم نفس الحجج” التي فعلتها مايكروسوفت في التسعينيات عندما رأت أن المصدر المفتوح يمثل تهديدًا لنموذج أعمالها. الحافة. ويتذكر أن ميتا أخبرته عن استثمارها المكثف في اللاما، وسألته “من تعتقد أنه سيكون قادرًا على فعل الشيء نفسه؟” رأى مافولي نمطًا مألوفًا: شركة تكنولوجيا عملاقة تستخدم التكلفة والتعقيد لتبرير إبقاء التكنولوجيا الخاصة بها مغلقة. وأضاف: “لقد عدنا إلى الأيام الأولى”.

وقال مافولي عن بيانات التدريب: “هذه هي خلطتهم السرية”. “إنه عنوان IP الثمين.”

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *