צפו: כך זה עובד - מודל התמונות של צ'אט ג'יפיטי
לפי חברת OpenAI, הכלי החדש מאפשר יצירה של תמונות מאפס, עריכה מתקדמת של תמונות קיימות ושינויים נקודתיים תוך שמירה על פרטים קיימים. בהודעת ההשקה נמסר כי המערכת מבצעת עריכות מדויקות יותר, מבינה טוב יותר את כוונת המשתמש, ושומרת על עקביות בין תוצרים שונים, בעיה מוכרת שזכתה לאין-ספור בדיחות בקהילת משתמשי הבינה המלאכותית. בתוך כך מבטיחה OpenAI גם שיפור משמעותי במהירות, עם יצירת תמונות שמהירה עד פי ארבעה מהדורות הקודמות.
חידוש נוסף הוא השקת לשונית Images ייעודית בתוך אפליקציית צ'אט ג'יפיטי ובגרסת הדפדפן. מדובר לא רק בכלי עבודה, אלא גם בפיד השראה שמציג רעיונות, סגנונות ושימושים אפשריים ליצירת תמונות. בחברה מסבירים כי המטרה היא להפוך את תהליך יצירת התמונות לחוויה אינטואיטיבית ומהנה יותר, שתעודד ניסוי וטעייה גם בקרב משתמשים שאינם מעצבים או אומנים מקצועיים.
מבחינה טכנולוגית, OpenAI מדגישה כי לא מדובר במהפכה אלא בליטוש עמוק של היכולות הקיימות. המודל החדש אמור להיות אמין יותר, להיצמד טוב יותר להנחיות טקסטואליות, ולשמור על פרטים קטנים גם כאשר מבצעים סדרה של עריכות חוזרות לאותה תמונה. יכולת זו חשובה במיוחד ליוצרים, מפרסמים ומעצבים שעובדים עם אותו דימוי לאורך זמן ודורשים עקביות גבוהה.
עם זאת, מבחני שטח ראשוניים מציירים תמונה מורכבת יותר. משתמשים שניסו לבצע את אותן עריכות בשני הכלים דיווחו על תוצאות דומות מאוד, כאשר לעיתים דווקא הגרסה של גוגל נתפסת כמרשימה יותר מבחינה ויזואלית. לדוגמה, עריכה של צילום רכב בלילה והפיכתו לסצנת יום הניבה בשני המקרים תוצאה סבירה, אך עם יתרון קל לגוגל בעיני חלק מהבודקים.