טירוף הבינה המלאכותית: מעכשיו ג'מיני יוצר עבורכם מוזיקה

גוגל השיקה יכולת חדשה בג'מיני שמאפשרת ליצור קטעי מוזיקה באורך 30 שניות על סמך הנחיה, וגם לבצע רמיקס לקטע קיים, באמצעות מודל בשם Lyria 3

ד"ר איתי גל צילום: אבשלום ששוני
 Lyria 3. קטעי מוזיקה באורך 30 שניות
Lyria 3. קטעי מוזיקה באורך 30 שניות | צילום: צילום מסך גוגל
3
גלריה

לפי ההכרזה, המשתמשים יכולים לכתוב לג'מיני תיאור של שיר או קטע אינסטרומנטלי, לקבל תוצאה מיידית, ולאחר מכן לחדד את ההנחיות עד שמתקבלת גרסה קרובה יותר למה שדמיינו. בגוגל מציגים את זה כגישה שמורידה חסמים ומאפשרת יצירה מהירה גם למי שאין לו ידע מוזיקלי. הדוגמות שמוצגות בהדגמות נשמעות משכנעות מבחינת כלי הנגינה והסאונד, אבל גם שם נרמזת נקודת התורפה המוכרת של מוזיקה גנרטיבית, מילים שנשמעות לעתים מוזרות, קיטשיות או לא טבעיות, גם אם העיבוד עצמו מלוטש.

אחד החידושים המשמעותיים הוא המעבר מיצירה שמבוססת על טקסט בלבד ליצירה שמושפעת גם מחומרים חזותיים. בג'מיני ניתן, לפי גוגל, להעלות תמונה או וידאו ולבקש מוזיקה שמתאימה לאווירה, לקצב או לאופי הסצנה. בתוך כך, גוגל מציינת שהקטעים יכולים להגיע יחד עם עטיפת אלבום שמופקת באמצעות מודל תמונה בשם Nano Banana, מה שמכוון מראש לשימושים של שיתוף ברשתות ובפלטפורמות וידאו קצר.

גוגל מחברת את היכולת החדשה גם ליוטיוב, דרך פיצ'ר בשם Dream Track שמיועד ליוצרי שורטס ומייצר פסי ליווי. המשמעות היא שיצירת מוזיקה לא נשארת בגבולות הצאטבוט, אלא נכנסת ישירות לצינור שבו נוצרים מדי יום מיליוני סרטונים קצרים. עבור יוטיוב, זה עוד כלי שמקטין תלות בספריות מוזיקה קיימות ובזכויות שימוש, ומצד שני עלול להעמיק את הוויכוח הישן על מקוריות, בעלות ותגמול בעידן של הפקה בלחיצת כפתור.

''ג'מיני''
''ג'מיני'' | צילום: באדיבות גוגל

במרכז המהלך עומד גם נושא האמון. בגוגל אומרים שכל קטע שמיוצר במערכת מסומן באופן בלתי מורגש באמצעות SynthID, טכנולוגיית סימון שמיועדת לזהות תוכן שנוצר בבינה מלאכותית של גוגל. החברה גם קידמה בשנה האחרונה כלי בדיקה בשם SynthID Detector שנועד לעזור לאתר סימונים כאלה בקבצים, כחלק ממאמץ רחב יותר להילחם בהתחזות ובתוכן מטעה. ההגבלה כאן ברורה, הסימון והבדיקה יעבדו בעיקר עבור תוכן שנוצר בכלים של גוגל, ולא בהכרח עבור תוצרים שמגיעים מחברות אחרות.

מהלך שמחבר בין הצ'אטבוט לבין עולם האודיו עם יצירה מטקסט, תמונה או וידאו
מהלך שמחבר בין הצ'אטבוט לבין עולם האודיו עם יצירה מטקסט, תמונה או וידאו | צילום מסך גוגל

אז האם גוגל מאיימת באמת על Suno, אחד הכלים הפופולריים ביותר ליצירת מוזיקה בבינה מלאכותית? התשובה מורכבת. מצד אחד, Suno מציעה כבר היום יצירת שירים ארוכים יותר, לפי מידע שמופיע במאגר העזרה שלה דורות מתקדמים מסוגלים לייצר דקות רבות ואף יותר לפני הארכה, בעוד גוגל מגבילה כרגע את ג'מיני ל 30 שניות. מצד שני, הכוח של גוגל נמצא במקום אחר, בהפצה. כשהיכולת יושבת בתוך ג'מיני, בתוך מוצרי גוגל, ועם חיבור ליוטיוב, היא יכולה להגיע למשתמשים שלא יטרחו להירשם לשירות ייעודי. התרחיש שבו מוזיקה נוצרת ישירות מתוך שיחה, ומשולבת אחר כך בהודעות או באפליקציות נוספות של גוגל, כבר מרחף ברקע גם אם החברה לא הכריזה על כך רשמית כחלק מההשקה.

לפי גוגל, היכולת מתחילה להיפתח כבר היום למשתמשים בני 18 ומעלה, ובשלב הראשון היא זמינה במספר שפות מוגדר, אנגלית, ספרדית, גרמנית, צרפתית, הינדי, יפנית, קוריאנית ופורטוגזית. עבור קהל ישראלי המשמעות היא שיצירה בעברית עדיין לא חלק מההשקה הראשונית, אבל היסטורית, כשיכולות כאלה נכנסות למוצרים המרכזיים של גוגל, הן נוטות להתרחב בהדרגה. השאלה הגדולה היא לא רק מתי זה יגיע לעברית, אלא איך ייראה השוק כשהמוזיקה המיוצרת תהפוך לעוד פיצ'ר סטנדרטי בתוך האפליקציות שכולנו כבר משתמשים בהן.

תגיות:
טכנולוגיה
/
מוזיקה
/
ג'מיני
/
בינה מלאכותית
/
AI
פיקוד העורף לוגוהתרעות פיקוד העורף