ما هي كمية الكهرباء التي تستهلكها مولدات الذكاء الاصطناعي؟


من المعروف أن التعلم الآلي يستهلك أ كثير من الطاقة. كل نماذج الذكاء الاصطناعي تلك التي تعمل على تشغيل ملخصات البريد الإلكتروني، وروبوتات الدردشة القاتلة، ومقاطع الفيديو لهومر سيمبسون وهو يغني نيو ميتال، تؤدي إلى تكبد فاتورة خادم ضخمة تقاس بالميغاواط في الساعة. ولكن يبدو أنه لا أحد – ولا حتى الشركات التي تقف وراء هذه التكنولوجيا – يستطيع أن يقول بالضبط ما هي التكلفة.

التقديرات موجودة بالفعل، لكن الخبراء يقولون إن هذه الأرقام جزئية ومشروطة، ولا تقدم سوى لمحة عن إجمالي استخدام الذكاء الاصطناعي للطاقة. وذلك لأن نماذج التعلم الآلي متغيرة بشكل لا يصدق، ويمكن تهيئتها بطرق تغير استهلاكها للطاقة بشكل كبير. علاوة على ذلك، فإن المنظمات الأكثر قدرة على إصدار مشروع القانون ــ شركات مثل ميتا، ومايكروسوفت، وأوبن إيه آي ــ لا تشارك ببساطة المعلومات ذات الصلة. (قالت جودي بريست، CTO للعمليات السحابية والابتكارات في Microsoft، في رسالة بالبريد الإلكتروني إن الشركة “تستثمر حاليًا في تطوير منهجيات لقياس استخدام الطاقة وتأثير الكربون في الذكاء الاصطناعي أثناء العمل على طرق لجعل الأنظمة الكبيرة أكثر كفاءة، التدريب والتطبيق على حد سواء.” ولم تستجب OpenAI وMeta لطلبات التعليق.)

أحد العوامل المهمة التي يمكننا تحديدها هو الفرق بين تدريب النموذج لأول مرة ونشره للمستخدمين. التدريب، على وجه الخصوص، يستهلك الكثير من الطاقة، ويستهلك كهرباء أكثر بكثير من أنشطة مراكز البيانات التقليدية. على سبيل المثال، تشير التقديرات إلى أن تدريب نموذج لغوي كبير مثل GPT-3 يستخدم ما يقل قليلاً عن 1300 ميجاوات في الساعة من الكهرباء؛ حوالي نفس القدر من الطاقة التي يستهلكها 130 منزلًا أمريكيًا سنويًا. لوضع ذلك في السياق، يتطلب بث ساعة من Netflix حوالي 0.8 كيلووات في الساعة (0.0008 ميجاوات في الساعة) من الكهرباء. وهذا يعني أنه سيتعين عليك مشاهدة 1,625,000 ساعة لاستهلاك نفس القدر من الطاقة اللازمة لتدريب GPT-3.

ولكن من الصعب أن نقول كيف ينطبق رقم كهذا على أحدث الأنظمة الحالية. يمكن أن يكون استهلاك الطاقة أكبر، لأن نماذج الذكاء الاصطناعي كانت تتجه بشكل مطرد نحو الأعلى في الحجم لسنوات، والنماذج الأكبر تتطلب المزيد من الطاقة. ومن ناحية أخرى، ربما تستخدم الشركات بعض الأساليب التي أثبتت جدواها لجعل هذه الأنظمة أكثر كفاءة في استخدام الطاقة، وهو ما من شأنه أن يخفف من الاتجاه التصاعدي لتكاليف الطاقة.

تقول ساشا لوتشيوني، الباحثة في شركة Hugging Face الفرنسية الأمريكية للذكاء الاصطناعي، إن التحدي المتمثل في إجراء تقديرات حديثة هو أن الشركات أصبحت أكثر سرية حيث أصبح الذكاء الاصطناعي مربحًا. لنعد إلى الوراء بضع سنوات فقط، وسوف تنشر شركات مثل OpenAI تفاصيل عن أنظمة التدريب الخاصة بها، وما هي الأجهزة التي تستخدمها وإلى متى. لكن نفس المعلومات ببساطة غير موجودة بالنسبة لأحدث النماذج، مثل ChatGPT وGPT-4، كما يقول لوتشيوني.

“مع ChatGPT، لا نعرف حجمه، ولا نعرف عدد المعلمات التي يحتوي عليها النموذج الأساسي، ولا نعرف أين يعمل… يمكن أن يكون ثلاثة راكون يرتدون معطفًا لأنك لا تعرف ذلك تعرف ما هو تحت غطاء محرك السيارة.

“من الممكن أن يكون هناك ثلاثة حيوانات راكون ترتدي معطفًا لأنك لا تعرف ما هو موجود تحت غطاء محرك السيارة.”

ويشير لوتشيوني، الذي قام بتأليف العديد من الأوراق البحثية التي تدرس استخدام طاقة الذكاء الاصطناعي، إلى أن هذه السرية ترجع جزئيًا إلى المنافسة بين الشركات ولكنها أيضًا محاولة لصرف الانتقادات. من الطبيعي أن تدعو إحصائيات استخدام الطاقة في الذكاء الاصطناعي – وخاصة حالات الاستخدام الأكثر تافهة – إلى إجراء مقارنات مع تبذير العملات المشفرة. وتقول: “هناك وعي متزايد بأن كل هذا لا يأتي مجانًا”.

تدريب النموذج ليس سوى جزء من الصورة. بعد إنشاء النظام، يتم طرحه للمستهلكين الذين يستخدمونه لتوليد المخرجات، وهي عملية تُعرف باسم “الاستدلال”. في ديسمبر الماضي، نشر لوتشيوني وزملاؤه من جامعة Hugging Face وجامعة كارنيجي ميلون ورقة بحثية (تنتظر حاليًا مراجعة النظراء) تحتوي على التقديرات الأولى لاستخدام طاقة الاستدلال في نماذج الذكاء الاصطناعي المختلفة.

أجرت لوتشيوني وزملاؤها اختبارات على 88 نموذجًا مختلفًا تغطي مجموعة من حالات الاستخدام، بدءًا من الإجابة على الأسئلة وحتى تحديد الأشياء وتوليد الصور. وفي كل حالة، قاموا بتنفيذ المهمة 1000 مرة وقدروا تكلفة الطاقة. تستخدم معظم المهام التي تم اختبارها كمية صغيرة من الطاقة، مثل 0.002 كيلووات في الساعة لتصنيف العينات المكتوبة و0.047 كيلووات في الساعة لإنشاء نص. إذا استخدمنا ساعة بث Netflix الخاصة بنا للمقارنة، فإن هذه تعادل الطاقة المستهلكة في مشاهدة تسع ثوانٍ أو 3.5 دقيقة على التوالي. (تذكر: هذه هي تكلفة أداء كل مهمة 1000 مرة). وكانت الأرقام أكبر بشكل ملحوظ بالنسبة لنماذج توليد الصور، التي استخدمت في المتوسط ​​2.907 كيلووات في الساعة لكل 1000 استدلال. كما تشير الورقة البحثية، يستخدم الهاتف الذكي المتوسط ​​0.012 كيلووات في الساعة للشحن – لذا فإن توليد صورة واحدة باستخدام الذكاء الاصطناعي يمكن أن استخدم قدرًا كبيرًا من الطاقة تقريبًا مثل شحن هاتفك الذكي.

ومع ذلك، يتم التركيز على “يمكن”، لأن هذه الأرقام لا تعمم بالضرورة في جميع حالات الاستخدام. اختبرت لوتشيوني وزملاؤها عشرة أنظمة مختلفة، بدءًا من النماذج الصغيرة التي تنتج صورًا صغيرة بحجم 64 × 64 بكسل إلى النماذج الأكبر التي تنتج صورًا بدقة 4K، وقد أدى ذلك إلى انتشار كبير للقيم. قام الباحثون أيضًا بتوحيد الأجهزة المستخدمة من أجل مقارنة نماذج الذكاء الاصطناعي المختلفة بشكل أفضل. لا يعكس هذا بالضرورة النشر في العالم الحقيقي، حيث غالبًا ما يتم تحسين البرامج والأجهزة لتحقيق كفاءة الطاقة.

يقول لوتشيوني: “من المؤكد أن هذا لا يمثل حالة الاستخدام للجميع، ولكن لدينا الآن على الأقل بعض الأرقام”. “أردت أن أضع علماً على الأرض قائلاً: “دعونا نبدأ من هنا”.”

“إن ثورة الذكاء الاصطناعي التوليدي تأتي بتكلفة كوكبية غير معروفة لنا تمامًا.”

ومن ثم، توفر الدراسة بيانات نسبية مفيدة، وإن لم تكن أرقامًا مطلقة. ويظهر، على سبيل المثال، أن نماذج الذكاء الاصطناعي تتطلب طاقة أكبر لتوليد المخرجات مما تتطلبه عند تصنيف المدخلات. كما يوضح أيضًا أن أي شيء يتضمن صورًا يستهلك طاقة أكبر من النص. يقول لوتشيوني إنه على الرغم من أن الطبيعة الطارئة لهذه البيانات يمكن أن تكون محبطة، إلا أنها تحكي قصة في حد ذاتها. وتقول: “إن ثورة الذكاء الاصطناعي التوليدي تأتي بتكلفة كوكبية غير معروفة تمامًا لنا، وانتشارها بالنسبة لي مؤشر بشكل خاص”. “الدكتور هو أننا لا نعرف.”

لذا فإن محاولة خفض تكلفة الطاقة اللازمة لتوليد بابا واحد من شركة بالنسياغا أمر صعب بسبب مستنقع المتغيرات. ولكن إذا أردنا أن نفهم التكلفة الكوكبية بشكل أفضل، فهناك طرق أخرى يتعين علينا اتباعها. ماذا لو قمنا بالتصغير بدلاً من التركيز على استنتاج النموذج؟

هذا هو النهج الذي يتبعه Alex de Vries، وهو مرشح لدرجة الدكتوراه في VU Amsterdam والذي ابتكر حسابًا لنفقات الطاقة في Bitcoin لمدونته عالم رقمي، والذي استخدم وحدات معالجة الرسوميات Nvidia – المعيار الذهبي لأجهزة الذكاء الاصطناعي – لتقدير الاستخدام العالمي للطاقة في هذا القطاع. كما يوضح دي فريس في التعليق المنشور في جول في العام الماضي، استحوذت Nvidia على ما يقرب من 95 بالمائة من المبيعات في سوق الذكاء الاصطناعي. تقوم الشركة أيضًا بإصدار مواصفات الطاقة لتوقعات الأجهزة والمبيعات.

من خلال الجمع بين هذه البيانات، يتوقع دي فريس أنه بحلول عام 2027 يمكن أن يستهلك قطاع الذكاء الاصطناعي ما بين 85 إلى 134 تيراواط ساعة كل عام. وهذا يعادل تقريبًا الطلب السنوي على الطاقة في موطن دي فريس، هولندا.

يقول دي فريس: “أنت تتحدث عن احتمال أن يصل استهلاك الذكاء الاصطناعي للكهرباء إلى نصف بالمائة من استهلاك الكهرباء العالمي بحلول عام 2027”. الحافة. “أعتقد أن هذا رقم كبير جدًا.”

وقدم تقرير حديث صادر عن وكالة الطاقة الدولية تقديرات مماثلة، مما يشير إلى أن استخدام مراكز البيانات للكهرباء سيزداد بشكل كبير في المستقبل القريب بفضل متطلبات الذكاء الاصطناعي والعملات المشفرة. وتقول الوكالة إن الاستخدام الحالي للطاقة في مراكز البيانات يبلغ حوالي 460 تيراواط ساعة في عام 2022 ويمكن أن يرتفع إلى ما بين 620 و1050 تيراواط ساعة في عام 2026 – أي ما يعادل متطلبات الطاقة في السويد أو ألمانيا، على التوالي.

لكن دي فريس يقول إن وضع هذه الأرقام في سياقها أمر مهم. ويشير إلى أنه بين عامي 2010 و2018، كان استخدام الطاقة في مراكز البيانات مستقرًا إلى حد ما، حيث يمثل حوالي 1 إلى 2 بالمائة من الاستهلاك العالمي. (وعندما نقول “مراكز البيانات” هنا فإننا نعني كل ما يشكل “الإنترنت”: من الخوادم الداخلية للشركات إلى جميع التطبيقات التي لا يمكنك استخدامها دون الاتصال بالإنترنت على هاتفك الذكي.) ارتفع الطلب بالتأكيد خلال هذه الفترة، يقول دي فريس، لكن الأجهزة أصبحت أكثر كفاءة، مما أدى إلى تعويض الزيادة.

ويخشى أن تكون الأمور مختلفة بالنسبة للذكاء الاصطناعي على وجه التحديد بسبب اتجاه الشركات إلى طرح نماذج أكبر والمزيد من البيانات في أي مهمة. يقول دي فريس: “إن هذه ديناميكية قاتلة حقًا للكفاءة”. “لأنه يخلق حافزًا طبيعيًا للناس للاستمرار في إضافة المزيد من الموارد الحسابية، وبمجرد أن تصبح النماذج أو الأجهزة أكثر كفاءة، سيجعل الناس هذه النماذج أكبر من ذي قبل.”

من المستحيل الإجابة على السؤال حول ما إذا كانت مكاسب الكفاءة ستعوض عن ارتفاع الطلب والاستخدام. ومثل لوتشيوني، يتحسر دي فريس على نقص البيانات المتاحة، لكنه يقول إن العالم لا يمكنه تجاهل الوضع فحسب. ويقول: “لقد كان الأمر صعبًا بعض الشيء لمعرفة الاتجاه الذي سيسير فيه هذا الأمر، وهو بالتأكيد ليس رقمًا مثاليًا”. “لكنه أساس كافٍ لإعطاء القليل من التحذير.”

تدعي بعض الشركات المشاركة في الذكاء الاصطناعي أن التكنولوجيا نفسها يمكن أن تساعد في حل هذه المشكلات. وقال بريست، متحدثًا باسم مايكروسوفت، إن الذكاء الاصطناعي “سيكون أداة قوية لتعزيز حلول الاستدامة”، وشدد على أن مايكروسوفت تعمل على تحقيق “أهداف الاستدامة المتمثلة في كونها سلبية للكربون، وإيجابية للمياه، وصفر نفايات بحلول عام 2030”.

لكن أهداف شركة واحدة لا يمكن أن تشمل الطلب الكامل على مستوى الصناعة. قد تكون هناك حاجة إلى أساليب أخرى.

تقول لوتشيوني إنها تود أن ترى الشركات تقدم تصنيفات نجوم الطاقة لنماذج الذكاء الاصطناعي، مما يسمح للمستهلكين بمقارنة كفاءة الطاقة بنفس الطريقة التي قد يفعلون بها مع الأجهزة. بالنسبة إلى دي فريس، يجب أن يكون نهجنا أكثر جوهرية: هل نحتاج حتى إلى استخدام الذكاء الاصطناعي في مهام معينة على الإطلاق؟ ويقول: “نظرًا لجميع القيود التي يواجهها الذكاء الاصطناعي، فمن المحتمل ألا يكون الحل الصحيح في الكثير من الأماكن، وسنضيع الكثير من الوقت والموارد في اكتشاف ذلك بالطريقة الصعبة”.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *