בוועידת המפתחים של גוגל שנערכה אמש (שלישי) לפי שעון ישראל, הכריזה החברה על שורה של שירותים חדשים המבוססים על מודל הבינה המלאכותית שלה, ג'מיני (Gemini או מזל תאומים). בנאום ארוך, הציג סונדר פיצ'אי, מנכ"ל גוגל את כל השיפורים והשילובים החדשים במוצרים קיימים של בינה מלאכותית במה שהוא מכנה "עידן התאומים" (Gemini Era).
החברה ראשית מרחיבה את כמות האסימונים (טוקנים) הזמינים למשתמשים מקצועיים תחת Gemini 1.5 Pro, השירות המקצועי ובתשלום של החברה למיליון אסימונים, ובעתיד תרחיב את הגישה לשני מיליון אסימונים (כרגע בניסוי סגור). המשמעות בפועל היא שמודל הבינה המלאכותית של גוגל יכול להתמודד ו-"ללעוס" מסמכים בני מאות עמודים, שעות של אודיו או שעה של וידאו ולהסיק מתוכם מידע, תובנות ומסקנות. לשם המחשת כמות הטקסט, גוגל מקבילים זאת ל-96 תפריטים של צ'יז'קייק פקטורי (רשת מסעדות הידועה בתפריטים עבי הכרס שלה).
עוד הכריזה גוגל על שילוב Gemini בשירות התמונות שלה בצורת שירות שנקרא Ask Photos. הרעיון הוא שמנוע הבינה המלאכותית יוכל לאתר לכם תמונה מתוך הארכיון העצום שלכם (לפי גוגל, מועלים לשירות שלהם ששה מיליארד תמונות וסרטונים מדי יום), לפי פרט טרייוואלי כמו למשל מספר לוחית של רכב שמופיע בתמונה. עוד ידע עכשיו שירות התמונות של גוגל לזהות מיקומים בתמונות פשוט על ידי ניתוח של התמונה.
כעת יאפשר גם המנוע חיפוש עם הקשר עמוק כמו התקדמות שיעורי השחיה של הילד, לדוגמא, ויציג לכם את כל התמונות הרלוונטיות במאגד אחד.
חלק נוסף בפיתוח של Gemini 1.5 Pro, הוא הטמעת יכולת הסקה רב-שלבית, מה שאומר שיהיה אפשר לתת ל-Gemini "ללעוס" משימות מורכבות, הכוללות מספר שלבים ולשלב ביניהן, שזו יכולת חדשה ומורכבת יותר - לדוגמא, יהיה אפשר לתת לו קובץ נתונים, להפוך אותם לטבלת אקסל, ואז לבקש ממנו לבנות מצגת על סמך טבלת האקסל שיצר, או לבקש ממנו להגיש החזר ישירות מתיבת המייל באופן אוטומטי על סמך קבלת רכישה. יהיה אפשר להשתמש ב-Gemini 1.5 כדי לנתח מיילים, לסכם קובצי PDF מצורפים ועוד, גם בגירסה הניידת של Gmail וגם ביישומים שונים באנדרואיד.
בצד היצירה, גוגל משיקה את Veo, מודל חדש ליצירת וידאו ואת Imagen3 שיוצר תמונות מהוראות טקסט (משהו שגוגל קצת נפלה איתו בסיבוב הקודם עם הטיית יתר לטובת מיעוטים...), וכלי חדשני ליצירת מוזיקה.
ולבסוף, גוגל גם תשלב את היכולות של Gemini במוצר הדגל שלה: מנוע החיפוש. במה שהיא מכנה AI Overview, היכולות של הבינה המלאכותית ישולבו בעמוד חיפוש חדש, בדומה למה שמיקרוסופט עושה עם CoPilot. העתיד עומד להיות מעניין.