הבינה המלאכותית הופכת לחלק בלתי נפרד מחיינו - היא מייצרת טקסטים ותמונות, עוזרת לרופאים באבחון, תורמת לחינוך מותאם אישית ומשפיעה באופן ישיר על הכלכלה הגלובלית. לצד היתרונות הברורים, הולך וגובר הדיון הציבורי סביב המחיר הסביבתי של טכנולוגיות מתקדמות אלה: כמה אנרגיה הן צורכות, כמה פליטות הן יוצרות וכמה מים נדרשים כדי להפעיל אותן בקנה מידה עצום.
כעת, גוגל חושפת לראשונה נתונים רשמיים ומפורטים על טביעת הרגל הסביבתית של מערכות ה-AI שלה, ובעיקר של משפחת המודלים Gemini. לפי הנתונים שפורסמו, בקשה טקסטואלית ממוצעת צורכת 0.24 וואט-שעה של אנרגיה, פולטת 0.03 גרם של פחמן דו-חמצני וצורכת 0.26 מיליליטר מים - כמות זעירה המקבילה בערך לחמש טיפות מים או לצפייה של פחות מתשע שניות בטלוויזיה.
המסמך שמפרסמת גוגל מדגיש כי מדובר בנתונים נמוכים בהרבה מההערכות שהופצו בציבור בשנים האחרונות. יתרה מכך, החברה מציינת כי במהלך 12 חודשים בלבד הצליחה להפחית פי 33 את צריכת האנרגיה ופי 44 את הפליטות הנלוות לבקשה ממוצעת, וכל זאת במקביל לשיפור ניכר באיכות התשובות שמספקים המודלים. בגוגל מייחסים את ההישגים הללו לשורה של שיפורים טכנולוגיים - החל ממבנה המודלים עצמם, דרך פיתוח חומרה ייעודית ושדרוג מערכות תוכנה, ועד לאופטימיזציה רחבת היקף של מרכזי הנתונים.
אחד המסרים המרכזיים במסמך הוא ביקורת על המתודולוגיות הנהוגות כיום לחישוב טביעת הרגל האנרגטית של AI. לטענת החברה, רבות מהן מתמקדות בצריכה הישירה של שבבים פעילים כמו GPU ו-TPU ומתעלמות ממכלול רחב של גורמים המשפיעים בפועל על התוצאה: שימוש במעבדי CPU וזיכרון RAM התומכים בהרצת המודלים, צריכת אנרגיה של מכונות רזרביות הנמצאות בסרק כדי לשמור על זמינות גבוהה, מערכות הקירור הנדרשות לתפעול שוטף, ואף השימוש במים לצינון מרכזי הנתונים. גוגל מדגישה כי רק שקלול כל המרכיבים הללו מאפשר לקבל תמונה אמיתית של ההשפעה הסביבתית של AI בקנה מידה עולמי.
המסמך מפרט גם את הטכנולוגיות שאיפשרו את שיפור היעילות. מודלי Gemini מבוססים על ארכיטקטורת Transformer שפותחה בגוגל ומספקת חיסכון ניכר בהשוואה לדורות קודמים של מודלים לשפה. החברה עושה שימוש בגישות כמו Mixture-of-Experts, שמפעילה בכל בקשה חלק קטן בלבד מתוך מודל ענק - ובכך מצמצמת משמעותית את נפח החישוב ואת כמות הנתונים הנדרשת. בנוסף, מיושמות טכניקות כמו Speculative Decoding, המאפשרת למודל קטן לבצע חיזוי ראשוני ולאמתו במהירות באמצעות מודל גדול יותר, ו- Distillation, תהליך שבמסגרתו נוצרים מודלים קטנים, מהירים ויעילים יותר שמבוססים על מודלים גדולים כחומרי הדרכה.
בגזרת החומרה מציינת גוגל את הדור החדש של שבבי ה-TPU שפיתחה - Ironwood - שלטענתה חסכוני פי 30 בצריכת אנרגיה לעומת הדור הראשון. גם מרכזי הנתונים שלה מוצגים כחלק מרכזי בסיפור: לפי החברה, הם פועלים עם מקדם יעילות אנרגטית ממוצע (PUE) של 1.09 בלבד, מהנמוכים ביותר בתעשייה.
לצד ההישגים הטכנולוגיים, גוגל חוזרת ומציינת את יעדיה הסביבתיים ארוכי הטווח. החברה שואפת לפעול באמצעות 100% אנרגיה נקייה בכל שעות היממה ובכל ימות השבוע, ומתחייבת להשיב למערכות האקולוגיות יותר מים מכמות הצריכה שלה בפועל. במקביל היא מבצעת הערכות סביבתיות מקומיות באזורים שונים בעולם כדי להבטיח שימוש אחראי במשאבי מים ולבחור בטכנולוגיות קירור מתאימות לכל אזור פעילות.