אחת ולתמיד: מדוע ChatGPT ממשיך להכניס מקף ארוך לטקסטים ואיך אפשר להיפטר ממנו?

משתמשים רבים בישראל גילו שטקסטים שנוצרו באמצעות ChatGPT כוללים מקפים ארוכים, בניגוד לנורמות הכתיבה המקובלות בעברית; התופעה הזו חוזרת שוב ושוב, גם כשמנסים להימנע ממנה - ומעוררת תסכול

ד"ר איתי גל צילום: מעריב אונליין
צ'אט ג'יפיטי
צ'אט ג'יפיטי | צילום: שאטרסטוק
2
גלריה
צ'אט GPT
צ'אט GPT | צילום: שאטרסטוק

גם כשמשתמשים מסבירים לו להימנע מהמקף הארוך, המודל עלול עדיין להכניס אותו, פשוט מפני שחלק מהמנגנונים האוטומטיים שמחליטים כיצד לחבר משפטים מסתמכים על מבנים שכיחים שהוא למד ממקורות זרים. למעשה, ChatGPT אינו "מבין" את כללי העריכה העבריים לעומק, אלא עובד לפי סטטיסטיקה של מילים ודפוסי כתיבה שנלמדו מראש, ולכן הוא מייצר שוב ושוב תבניות שבהן מופיע המקף הארוך.

הבעיה מוחמרת עוד יותר כשכותבים טקסט ארוך או טקסט רשמי. במצבים כאלה, המודל מנסה “לרווח” את המשפטים ולהוסיף הדגשות, ותופס את ה-Em Dash כאמצעי נוח לסימון הפסקה פתאומית או הערה מוסגרת. בלי הנחיה ברורה וחוזרת, ואפילו אז לא תמיד בהצלחה, ChatGPT יחזור לסגנון האנגלי שאליו הורגל.

אז מה בכל זאת אפשר לעשות כדי לצמצם את התופעה? ראשית, כדאי להקפיד לציין במפורש בתחילת כל פנייה למודל את ההעדפה להשתמש בפסיקים או בנקודות בלבד, בלי מקפים כלל. למשל לכתוב: אל תשתמש במקף ארוך בטקסט, אלא בפסיקים או נקודות. זוהי בקשה שחשוב לחזור עליה גם בהנחיות חוזרות, כי המודל “שוכח” בקלות את דרישות הסגנון כשהוא מייצר תשובות חדשות.

שנית, לאחר הפקת הטקסט, מומלץ לבצע בו סריקה ידנית או אוטומטית ולהחליף את כל ה-Em Dash במקף קצר או בפסיק. אפשר לעשות זאת גם באמצעות פונקציות חיפוש והחלפה בתוכנות עיבוד תמלילים.

שלישית, כאשר מזינים למודל דוגמאות סגנוניות בעברית תקנית מראש, עם שימוש עקבי בפסיקים או נקודות, אפשר לסייע לו ללמוד מההקשר ולהימנע מהכנסת המקפים הארוכים.

תגיות:
בינה מלאכותית
/
צ'אט GPT
פיקוד העורף לוגוהתרעות פיקוד העורף