זיהוי אוטומטי של רגשות בטקסט הוא אתגר מורכב ביותר, המעסיק חוקרים רבים ברחבי העולם בשל הפוטנציאל העסקי הטמון בו והעניין המדעי שהוא מעורר. לוטם פלד, סטודנטית לתואר שני בפקולטה להנדסת תעשייה וניהול בטכניון, פיתחה מערכת המאפשרת לפרש אמירות סרקסטיות בטוויטר. זיהוי רגשות עשוי לשמש ביישומים חברתיים, מסחריים ואחרים ולשפר את התקשורת בין אדם למחשב ובין אנשים המשתמשים ברשתות חברתיות.



למרות ההתפתחות העצומה בתחום זה, וההצלחות בניתוח רגשות, היישומים הקיימים אינם יודעים להתמודד עם לשון צינית וסרקסטית, ההופכת על פיה את כוונת הכותב. לדוגמה, אם נפרש ציוץ סרקסטי כמו "הסרט החדש של מהיר ועצבני פשוט מצוין", פשוטו כמשמעו, נפספס לחלוטין את מהות האמירה.



לוטם פלד, צילום: דוברות הטכניון
לוטם פלד, צילום: דוברות הטכניון



לדברי פלד, שפיתחה את המערכת החדשה בהנחיית פרופ' רועי רייכרט, "קיימות הרבה מערכות שמטרתן זיהוי סרקזם, אבל זאת המערכת הראשונה בעולם שמפרשת סרקזם בטקסט כתוב. אנחנו מקווים שבעתיד היא תסייע, בין השאר, לאנשים בעלי אוטיזם ותסמונת אספרגר המתקשים עם פירוש של סרקזם, אירוניה והומור". המערכת החדשה, המבוססת על תרגום מכונה, הופכת משפטים סרקסטיים למשפטים כנים. למשל, את המשפט האמור, "הסרט החדש של מהיר ועצבני פשוט מצוין" היא תהפוך למשפט: "הסרט החדש של מהיר ועצבני איום ונורא".



כדי ללמד את המערכת לייצר את הפירושים האלה, הרכיבו החוקרים בסיס נתונים ובו 3,000 ציוצים סרקסטיים. לכל אחד מהציוצים "הוצמדו" חמישה פירושים לא סרקסטיים. על בסיס נתונים אלה, אומנה המערכת לזהות מילים בעלות סנטימנט, למשל המילה Best בציוץ Best day ever, ולהחליף אותן במילים חריפות החושפות את המשמעות של הכתוב, לדוגמה: Worst day ever. המערכת נבדקה על ידי שורת שופטים ונמצא כי במרבית המקרים היא מייצרת משפט נכון הן מבחינה סמנטית הן מבחינה לשונית.