ההכרזה הבולטת ביותר הייתה משפחת המודלים Gemini 3.5, ובראשה Gemini 3.5 Flash, מודל מהיר יותר שמיועד למשימות מורכבות, קידוד, עבודה רב-שלבית והפעלת סוכנים. לפי גוגל, המודל החדש ישולב כברירת מחדל באפליקציית Gemini ובמצב AI במנוע החיפוש. בחברה מציגים אותו כמודל שמסוגל לבצע משימות ארוכות יותר, להבין קלטים ממגוון סוגים, כמו טקסט, תמונות, וידאו, אודיו וקבצים, ולפעול מהר יותר בדור החדש של כלי ה-AI.
צפו: סרטון ההכרזה המלא
לצד Gemini 3.5 Flash הציגה גוגל את Gemini Omni, מודל חדש ליצירת וידאו ועריכתו. לפי החברה, Omni נועד לאפשר יצירה מסרטונים, תמונות, טקסט ואודיו, ולא רק מתיאור מילולי קצר. המשתמש יוכל לבקש מהמערכת ליצור סרטון חדש, לערוך סרטון קיים, להחליף דמויות, לשנות תאורה, לייצב מצלמה או לשנות מרכיבים בסצנה באמצעות שיחה עם המודל. גוגל טוענת שהמודל מבוסס גם על הבנה טובה יותר של תנועה, כבידה, אנרגיה קינטית ודינמיקה פיזיקלית, כדי להפיק סרטונים מציאותיים יותר.
הפיצ'ר החדש צפוי להגיע תחילה למנויים בתשלום באפליקציית Gemini וב-Google Flow, בשלב ראשון באנגלית. בתוך כך הציגה גוגל גם את Gemini Omni Flash, גרסה ראשונה ומהירה יותר במשפחת Omni, שתשולב בכלי יצירת המדיה של החברה. אחת האפשרויות המסקרנות, והרגישות יותר, היא יצירת אווטאר AI שנראה ונשמע כמו המשתמש. בגוגל מדגישים שכל סרטון שנוצר במודלים החדשים יסומן באמצעות SynthID, סימון דיגיטלי בלתי נראה שנועד לסייע בזיהוי תוכן שנוצר בבינה מלאכותית.
החידוש המשמעותי השני הוא Gemini Spark, סוכן AI אישי שאמור לבצע משימות עבור המשתמש. בניגוד לצ'אטבוט רגיל, Spark לא מסתפק בתשובה לשאלה, אלא אמור לתכנן, לארגן, לעבד מידע ולפעול בתוך שירותי Google. לפי גוגל, הוא יוכל למשל לסכם מיילים, הערות מפגישות וצ'אטים, להכין מסמך עם משימות לביצוע, לתכנן אירוע או חופשה, ולהציע פעולות המשך. החברה מדגישה שפעולות רגישות, כמו שליחת מייל או ביצוע רכישה, ידרשו אישור מפורש של המשתמש.
סביב אותו רעיון הכריזה גוגל גם על "תקציר יומי" באפליקציית Gemini. הפיצ'ר אמור לסרוק מדי לילה את היומן, המשימות והמיילים של המשתמש, ולבנות תמונת מצב של היום הקרוב: מה דחוף, מה חשוב, אילו משימות דורשות טיפול, ומה ניתן לבצע בעזרת Gemini. בשלב הראשון השירות יהיה זמין בארצות הברית בלבד, למשתמשים מעל גיל 18 ובמסגרת מנויי Google AI.
מנוע החיפוש של Google מקבל את אחד השינויים הגדולים ביותר שלו זה שנים. החברה הציגה "תיבת חיפוש AI" חדשה, שנועדה להתאים את עצמה לשאלות ארוכות, מורכבות ושיחתיות יותר. במקום הקלדה קצרה של מילות מפתח, המשתמשים יוכלו לצרף קבצים, תמונות, סרטונים ואף טאבים פתוחים בדפדפן, ולקבל תשובה שמבוססת על שילוב המידע. גוגל תנסה לחדד את השאלה, להבין את הכוונה ולהציג תשובה מותאמת יותר, לצד קישורים רלוונטיים.
מצב AI בחיפוש יעבור לפעול על Gemini 3.5 Flash, וגוגל מציגה אותו כמהיר יותר וכמותאם יותר לחיפושים מורכבים. החברה הכריזה גם על Seamless Search, מעבר חלק בין מצב AI לבין סקירות AI, כך שהקשר החיפוש נשמר והתוצאות מתעדכנות בהתאם. במילים פשוטות, גוגל רוצה שהחיפוש יהפוך משדה טקסט סטטי לשיחה מתמשכת עם מנוע שיודע לזכור מה כבר חיפשתם באותו רצף ולהציע את הצעד הבא.
אחד התחומים שבהם גוגל מנסה להפוך את החיפוש לפעולה ממשית הוא קניות. Universal Cart, סל הקניות המאוחד החדש, אמור לרכז מוצרים ממגוון אתרי קניות ושירותי Google. המשתמש יוכל להוסיף פריט שמצא בחיפוש, בהמלצה של Gemini, ובהמשך גם ביוטיוב או בג'ימייל. הסל יעקוב אחר ירידות מחירים, זמינות במלאי, הטבות, היסטוריית מחירים ואף התאמה בין מוצרים. בדוגמה שהציגה גוגל, מי שמרכיב מחשב יוכל לקבל התראה אם אחד הרכיבים שבחר לא מתאים לשאר המערכת.
במקביל הכריזה גוגל על Information Agents, סוכנים שיעקבו אחר מידע משתנה בזמן אמת, כמו מחירי טיסות, זמינות מוצרים, אירועים, מניות או עדכוני ספורט. במקום לחזור שוב ושוב לאותו חיפוש, המשתמש יוכל להגדיר מה מעניין אותו, והסוכן יעדכן אותו כשיש שינוי רלוונטי. בשלב הבא, Agentic Bookings יאפשרו לסוכנים לבצע הזמנות, כמו כרטיסים להופעות, שולחנות במסעדות ותורים לשירותים שונים, תחילה בארצות הברית ובהמשך בתחומים נוספים.
גם עולם הפיתוח קיבל מקום מרכזי בכנס. Google Antigravity 2.0 הוצגה כאפליקציית דסקטופ לניהול כמה סוכני AI במקביל, שמסוגלים לבצע משימות מורכבות בו-זמנית. המערכת שודרגה עם Gemini 3.5 Flash, והיא מיועדת בעיקר למפתחים, צוותי מוצר ומשתמשים מתקדמים שרוצים להפעיל כמה תהליכי עבודה במקביל. Google AI Studio קיבל גם הוא הרחבות, בהן אפליקציית מובייל חדשה, חיבור לכלי Google Workspace, תמיכה ב-Kotlin לבניית אפליקציות אנדרואיד באמצעות פקודות פשוטות, ואפשרות להעלות אפליקציות לבדיקה ולקבל משוב ראשוני ממשתמשים.
בגזרת המדיה הגנרטיבית הציגה גוגל את Google Pics ב-Workspace, כלי ליצירה ועריכה של תמונות, פליירים, מצגות ואינפוגרפיקות. המשתמשים יוכלו לשנות פורמט, להזיז אובייקטים, לשנות גודל ולערוך תמונות באמצעות הוראות טקסט. Google Flow, כלי הווידאו היצירתי של החברה, מקבל את Flow Agent, שותף יצירתי בתוך המערכת, ואת Flow Tools, שמאפשרים לבנות כלי יצירה חדשים, כמו אפקטים לווידאו או אנימציות, באמצעות פקודות טבעיות.
ב-DeepMind הציגה גוגל את GeoGenie, הרחבה לפרויקט Genie, שמאפשרת לבחור מיקום אמיתי בעולם מנתוני Street View ולהפוך אותו לסביבת משחק תלת-ממדית ב-360 מעלות. הרעיון מבוסס על טכנולוגיה שממירה מיקום לווידאו ולעולם וירטואלי, ופותח פתח לשימושים במשחקים, סימולציות, תיירות וירטואלית והדרכה.
גם המשקפיים החכמים חוזרים למרכז הבמה. Android XR יוצג בשני סוגי דגמים: משקפיים עם ממשק קולי ישירות לאוזן, ומשקפיים עם מסך מובנה בעדשות שמציג מידע בזמן אמת. Gemini ישולב בהם כעוזר אישי, שיוכל לספק הנחיות, תרגום, מידע על הסביבה, הודעות ופעולות נוספות בלי להוציא את הטלפון מהכיס. לפי הדיווחים, הדגמים הראשונים צפויים להגיע בסתיו, בשיתוף חברות כמו סמסונג ומותגי משקפיים.
האתגר הגדול של גוגל לא יהיה רק טכנולוגי. ככל שהסוכנים שלה יקבלו גישה ליומן, למייל, לקניות, להעדפות האישיות ולמידע מתוך אפליקציות מקושרות, כך יגדל הצורך באמון מצד המשתמשים. השאלה כבר לא תהיה רק האם Gemini יודע לענות נכון, אלא האם המשתמשים מוכנים לאפשר לו לפעול בשמם, לעקוב אחר מידע אישי, לנסח מסמכים, להציע קניות ולנהל חלק מהיום שלהם. בכנס הנוכחי גוגל הציגה חזון שאפתני מאוד, אבל גם כזה שידרוש ממנה להוכיח שקיפות, אבטחה וזהירות לא פחות משהיא מוכיחה מהירות ועוצמה.