גם כשמשתמשים מסבירים לו להימנע מהמקף הארוך, המודל עלול עדיין להכניס אותו, פשוט מפני שחלק מהמנגנונים האוטומטיים שמחליטים כיצד לחבר משפטים מסתמכים על מבנים שכיחים שהוא למד ממקורות זרים. למעשה, ChatGPT אינו "מבין" את כללי העריכה העבריים לעומק, אלא עובד לפי סטטיסטיקה של מילים ודפוסי כתיבה שנלמדו מראש, ולכן הוא מייצר שוב ושוב תבניות שבהן מופיע המקף הארוך.
הבעיה מוחמרת עוד יותר כשכותבים טקסט ארוך או טקסט רשמי. במצבים כאלה, המודל מנסה “לרווח” את המשפטים ולהוסיף הדגשות, ותופס את ה-Em Dash כאמצעי נוח לסימון הפסקה פתאומית או הערה מוסגרת. בלי הנחיה ברורה וחוזרת, ואפילו אז לא תמיד בהצלחה, ChatGPT יחזור לסגנון האנגלי שאליו הורגל.
אז מה בכל זאת אפשר לעשות כדי לצמצם את התופעה? ראשית, כדאי להקפיד לציין במפורש בתחילת כל פנייה למודל את ההעדפה להשתמש בפסיקים או בנקודות בלבד, בלי מקפים כלל. למשל לכתוב: אל תשתמש במקף ארוך בטקסט, אלא בפסיקים או נקודות. זוהי בקשה שחשוב לחזור עליה גם בהנחיות חוזרות, כי המודל “שוכח” בקלות את דרישות הסגנון כשהוא מייצר תשובות חדשות.
שנית, לאחר הפקת הטקסט, מומלץ לבצע בו סריקה ידנית או אוטומטית ולהחליף את כל ה-Em Dash במקף קצר או בפסיק. אפשר לעשות זאת גם באמצעות פונקציות חיפוש והחלפה בתוכנות עיבוד תמלילים.
שלישית, כאשר מזינים למודל דוגמאות סגנוניות בעברית תקנית מראש, עם שימוש עקבי בפסיקים או נקודות, אפשר לסייע לו ללמוד מההקשר ולהימנע מהכנסת המקפים הארוכים.