מי צדק - ChatGPT או Claude? חודש אחרי הניסוי, יש לנו מנצח

ניסוי טכנולוגי חביב שנועד לבדוק האם בינה מלאכותית יכולה להרכיב תיק השקעות חכם הפך למבחן מפתיע בין החלטיות לשמרנות. חודש אחר כך, הפער בין התיקים עומד על כחצי אחוז

14:22 05/10/2025

גלריה

ההנחיה שהם קיבלו הייתה לבנות תיק השקעות המבוסס אך ורק על הנתונים המספריים שבטבלה, ללא כל הסתייעות במידע חיצוני, סקירות אנליסטים או תחזיות מאקרו. בשלב הראשון של הניסוי, כאשר שני המנועים נדרשו להסתמך על הנתונים היבשים בלבד, ChatGPT קרא את המספרים כעדות לעלייה חדה בישראל ובארצות הברית, והסיק שעל המשקיע למקד את השקעותיו בשני השווקים הללו. Claude, לעומתו, פירש את אותם הנתונים באופן אחר. הוא ראה בתמונה "מעורבת" ואף ציין ירידות באירופה, והמליץ להימנע מהימור על אזור מסוים, תוך שמירה על פיזור רחב בין השווקים.

בשלב השני, הרשנו למנועי הבינה המלאכותית להיעזר גם במידע עדכני מהאינטרנט, אך הם הונחו להסתמך על נתונים בלבד, ללא ניתוחים פרשניים. ChatGPT ניצל את המידע החדש כדי לעדכן מעט את המלצותיו: הוא העלה את המשקל לארה"ב בעקבות נתוני סגירה חזקים יותר במדד S&P 500, והפחית את הרתיעה מאירופה. Claude, לעומת זאת, הרחיב את נקודת המבט לשנה שלמה, שילב נתונים נוספים על ביצועי שווקים ועל רמות תנודתיות, והדגיש גישה זהירה המתבססת על השקעה הדרגתית ומפוזרת.

בשלב השלישי והאחרון ביקשנו משני המנועים להפסיק לדבר בכלליות ולעבור למספרים - להציג אלוקציה ממשית של תיק השקעות מפורט כשהם יכולים להיעזר בכל מידע שקיים באינטרנט. כלומר, לא רק נתונים אלא גם המלצות, תחזיות וניתוחים של אנליסטים. כאן ההבדלים נחשפו במלואם. ChatGPT הציע תיק ממוקד ופשוט: דגש על ישראל וארצות הברית, עם פיזור מתון לאירופה וליפן ורגל קטנה במזומן. Claude לעומתו בנה תיק מגוון בהרבה שכלל גם נכסים שלא הופיעו כלל בשאלה הראשונית – ביניהם קריפטו ואג"ח – ונתן משקל גבוה במיוחד לרכיבים סולידיים, על חשבון מניות.

את החישוב עשינו על סמך נתוני הסגירה של המדדים בסוף ספטמבר לעומת סוף אוגוסט. הנתונים נלקחו מאתר Investing.com, למעט מדד ת"א־125 שנלקח מאתר הבורסה לניירות ערך בתל אביב. לצורך אחידות, השתמשנו במדדים רחבים כ"פרוקסי" (proxy) לכל אזור השקעה: מדד ת"א־125 מייצג את השוק הישראלי כולו, S&P 500 ו־Dow Jones משמשים לייצוג הכלכלה האמריקאית (זו הכלכלה היחידה שעבורה נלקחו 2 מדדים, מכיוון שהבינה המלאכותית ציינה אותם במפורש), Euro Stoxx 50 נבחר כמדד כלל־אירופי מרכזי, ו־Nikkei 225 כמייצג את השוק היפני. עבור נכסי הקריפטו נבחר ביטקוין כמדד מוביל, בשל מעמדו כמטבע הבסיס והמשקף ביותר של הסקטור כולו.

בחודש ספטמבר נרשמה עלייה רוחבית בשווקים: מדד ת"א־125 עלה ב־4.33%, ה־S&P 500 התחזק ב־3.53%, הדאו ג'ונס ב־1.87%, מדד יורו סטוקס 50 ב־3.33%, והניקיי היפני ב־6.17%. גם הביטקוין עלה ב־5.38%. באשר לרכיב הסולידי - כלומר האג"ח והפיקדונות - מאחר שמדובר בחודש אחד בלבד, ההבדלים בין סוגי האג"ח כמעט אינם משמעותיים, ולכן הנחנו עבור כולם תשואה חודשית זהה של 0.38%, בהתאם לריבית בנק ישראל השנתית (4.5%) חלקי 12.

בשורה התחתונה, לאחר שקלול כל המשקולות, התיק שעליו המליץ ChatGPT הניב תשואה חודשית כוללת של 3.59%, לעומת 3.20% בלבד בתיק של Claude – פער קטן אך ברור לטובת המנוע שהעדיף את השוק הישראלי והאמריקאי. גם הקפיצה המרשימה של הביטקוין, שעלה בספטמבר ביותר מ־5%, לא הצליחה לסגור את הפער. המשקל שלו בתיק של Claude היה קטן מדי, והוא הוחזק כחלק זניח בתוך רכיב סולידי גדול של מזומן ואג"ח.

הפער בתוצאות בין שני המנועים אינו גדול, וכמו שסייגנו חודש אחד אינו מדד מספק להשוואה אמיתית בין שתי אסטרטגיות השקעה, אך הוא ממחיש היטב את ההבדלים בגישה ומספק הצצה לאופן שבו כל מנוע חושב. ChatGPT פעל כמו אנליסט שמחפש מגמה ברורה ומוכן לקחת סיכון מחושב – הוא קרא את הנתונים כפשוטם, בחר כיוון, והצמיד אליו משקל עודף. Claude, לעומתו, התנהג יותר כמו יועץ השקעות שמרן: הוא הרחיב את ההסתכלות, הפחית ריכוזיות, ובחר באיזון גם במחיר של ויתור על תשואה פוטנציאלית.

בסופו של דבר, המסקנה אולי פחות טכנולוגית ויותר אנושית. גם הבינה המלאכותית נאלצת לבחור בין שתי דרכים ישנות – בין הפשטות של לשים את רוב הז'יטונים על הסוס המנצח, לבין פיזור וזהירות שמביאה שקט נפשי. מי מהן עדיפה? כמו תמיד, זה תלוי לא רק באלגוריתם – אלא באופי של המשקיע.