לשמוע את הטקסט: גוגל השיקה פלטפורמה ליצירת קריינות – וזה מדהים

פלטפורמת AI Studio של גוגל מציעה כעת את האפשרות להפוך כל טקסט לקובץ אודיו באיכות גבוהה ובקול אנושי טבעי. בעזרת ממשק נגיש ומגוון רחב של קריינים, הפיצ'ר החדש מבטיח לשנות את הדרך שבה אנו צורכים מידע

ד"ר איתי גל צילום: מעריב אונליין
מטה גוגל. מאודיו לטקסט ולהיפך (
מטה גוגל. מאודיו לטקסט ולהיפך ( | צילום: שאטרסטוק
3
גלריה

הכלי, שנמצא תחת פלטפורמת AI Studio של גוגל, מיועד לכל אחד – מסטודנטים שמבקשים להאזין למאמרים בזמן הליכה, דרך יוצרי תוכן שמעוניינים להנגיש את הכתבות שלהם לקהלים חדשים, ועד אנשים עם מוגבלות ראייה שרוצים לצרוך תוכן באוזן ולא בעין.

בשונה מכלים קיימים אחרים, הכלי של גוגל מציע גם אפשרות להקראת טקסטים מרובי דוברים, כלומר הקראת דיאלוגים באמצעות קריינים וירטואליים שונים, שכל אחד מהם נשמע שונה לחלוטין.

מסך הפלטפורמה. מטעינים והאודיו נוצר תוך דקות ספורות
מסך הפלטפורמה. מטעינים והאודיו נוצר תוך דקות ספורות | צילום: מעריב אונליין

המשתמש יוצר "הנחיה חדשה", בוחר את סוג ההנחיה כ"המרת טקסט לקול", מדביק את הטקסט, ובוחר את הקריינים מתוך מגוון רחב של קולות אנושיים – צעירים, מבוגרים, נשים וגברים, ולעיתים גם בעלי מבטאים שונים בהתאם לשפה.

באפשרות המשתמש גם לקבוע אם מדובר בקריינות של קול אחד רציף, או קריינות מרובת דוברים, שם ניתן להקצות קול אחר לכל פסקה או שורה. לצורך כך, ניתן לסמן את הטקסט עם תגיות כמו [דובר 1] או [דובר 2] כדי שהמערכת תדע להחליף בין הקולות. בכך נוצרת הקראה דינמית, שמזכירה אודיו דרמטי או תסכית רדיו.

מלבד בחירת הקריינים, הפלטפורמה מאפשרת גם להתאים את קצב הדיבור, גובה הקול, טון הדיבור והדגשות קוליות. כך, ניתן לדוגמה להפוך מאמר מקצועי להקראה איטית ונינוחה, או סיפור לילדים לקול שמח ומדגיש. גוגל אף מציעה תמיכה בשפות רבות, כאשר בעברית – גם אם התמיכה עדיין בסיסית יחסית – ישנם כבר קולות איכותיים.

לאחר סיום הבחירות וההגדרות, לוחצים על כפתור "Generate" והמערכת יוצרת את קובץ האודיו. לאחר עיבוד קצר, שנמשך בין שניות בודדות לכמה דקות בהתאם לאורך הטקסט, מוצג הקובץ להאזנה ישירה. אם התוצאה משביעת רצון, ניתן גם להוריד את הקובץ בפורמטים MP3 או WAV ולשמור אותו.

מטה גוגל. צפויים להגיב על המהלך
מטה גוגל. צפויים להגיב על המהלך | צילום: שאטרסטוק

השימושים האפשריים בפלטפורמה כמעט אינסופיים: סטודנטים יכולים להאזין לחומרי לימוד בזמן אימון או נסיעה, אנשי שיווק יכולים ליצור תכנים קוליים למיתוג, מורים יכולים להנגיש חומרים לתלמידים בעלי קשיי קריאה, ועיתונאים יכולים להפוך כתבות למדיה שמע המאפשרת חוויית קריאה נוספת.

בגוגל לא שכחו לעשות גם את הפעולה ההפוכה: ניתן להמיר קובץ קול גם לטקסט. התוצאה כאן לא תמיד מושלמת, וכמובן שהמשתמש נדרש לעבור על התוצאה ולתקן פה ושם טעויות בעברית. בדקנו את זה, ומה שמתקבל יצא לפחות לנו, מדוייק למדי, למעט תיקונים קלים פה ושם.

את המרת הקול לטקסט משתמשי גוגל כבר מכירים, בעיקר הסטודנטים שביניכם, מפלטפורמת NoteboolkLM המצויינת, ועתה כאמור היא גם ב- AI Studios בממשק קל פשוט וידידותי יותר.

תגיות:
גוגל
/
טכנולוגיה
/
AI
פיקוד העורף לוגוהתרעות פיקוד העורף