חדר המיון הוא אחד המקומות המורכבים ביותר ברפואה. בתוך דקות נדרשים הרופאים להחליט אם כאב בחזה הוא חרדה, דלקת, תסחיף ריאתי או התקף לב; אם כאב ראש הוא מיגרנה או דימום מוחי; ואם חום גבוה הוא מחלה ויראלית חולפת או תחילתו של זיהום מסכן חיים. ההחלטות מתקבלות תחת עומס, מחסור בזמן, מידע חלקי ולעיתים גם לחץ מצד מטופלים ובני משפחותיהם.
באחד הניסויים נבדקו 76 מטופלים שהגיעו לחדר מיון בבוסטון. גם המודל וגם זוגות של רופאים קיבלו את אותו מידע מתוך הרשומה הרפואית הממוחשבת: סימנים חיוניים, נתונים דמוגרפיים וכמה משפטים שתיעדה אחות לגבי סיבת ההגעה למיון. על בסיס המידע המצומצם הזה התבקשו המשתתפים להגיע לאבחנה. הבינה המלאכותית זיהתה את האבחנה המדויקת או אבחנה קרובה מאוד ב-67% מהמקרים, בעוד שהרופאים הגיעו לדיוק של 50% עד 55%.
כשהמודל קיבל מידע מפורט יותר, הדיוק שלו עלה ל-82%. הרופאים המומחים הגיעו באותו שלב לדיוק של 70% עד 79%, אבל לפי הדיווח ההבדל הזה לא היה מובהק סטטיסטית. המשמעות היא שהיתרון של הבינה המלאכותית היה ברור במיוחד בשלב המוקדם של המיון, דווקא כשיש מעט מידע והצורך לקבל החלטה מהירה גבוה במיוחד.
ניסוי אחר בדק לא רק אבחנה, אלא גם תכנון טיפול. המודל ו-46 רופאים התבקשו לבחון חמישה תיאורי מקרה קליניים ולהציע תוכניות טיפול ארוכות יותר, כמו משטרי אנטיביוטיקה או תכנון טיפול בסוף החיים. לפי הנתונים שדווחו, המודל קיבל ציון של 89%, לעומת 34% בקרב הרופאים שהשתמשו בכלים מקובלים כמו מנועי חיפוש. זהו פער חריג, אבל גם כזה שדורש זהירות בפרשנות: מדובר במבחן מובנה, לא בטיפול חי במטופל שנמצא מול הרופא בחדר.
אחת הדוגמאות במחקר מדגימה את הפוטנציאל של המערכת. מטופל הגיע עם קריש דם בריאות ותסמינים שהלכו והחמירו. הרופאים סברו שהטיפול בנוגדי קרישה לא מצליח. המודל, לעומת זאת, הבחין בפרט אחר: למטופל הייתה היסטוריה של זאבת, מחלה אוטואימונית שעלולה לגרום לדלקת בריאות. לפי החוקרים, ההשערה של המודל התבררה כנכונה.
למרות התוצאות המרשימות, המחקר לא מוכיח שרופא המיון עומד להיעלם. להפך. החוקרים עצמם הדגישו שהמודל בחן מידע כתוב בלבד, ולא נדרש לבצע את מה שרופא עושה במפגש אמיתי: להתרשם ממראה המטופל, מצבע העור, מקוצר הנשימה, מרמת הכאב, מהחרדה, מהשינוי בקול, מהאינטראקציה עם בני המשפחה ומהאינטואיציה הקלינית שנבנית לעיתים בתוך שניות. במילים אחרות, המודל פעל יותר כמו יועץ נוסף על סמך מסמכים, ולא כמו רופא שמקבל אחריות מלאה על מטופל חי.
הנתונים מגיעים בתקופה שבה רופאים כבר משתמשים יותר ויותר בכלי בינה מלאכותית. לפי הדיווח, כמעט אחד מכל חמישה רופאים בארצות הברית כבר נעזר בבינה מלאכותית לצורכי אבחון, ובבריטניה 16% מהרופאים משתמשים בה מדי יום ועוד 15% מדי שבוע. אחד השימושים המרכזיים שדווחו הוא תמיכה בקבלת החלטות קליניות.
אבל לצד ההתלהבות, החששות כבדים. טעות של בינה מלאכותית עלולה להיראות משכנעת מאוד, במיוחד כשהיא מנוסחת בביטחון. רופא עלול לקבל את תשובת המודל בלי לבחון אותה באופן עצמאי, תופעה שמומחים מכנים לעיתים הסתמכות יתר או הטיית אוטומציה. רופאים כבר הזהירו שהנטייה הזו עלולה להתחזק ככל שהטכנולוגיה תהפוך לשגרתית יותר בבתי החולים. הוא ציין שגם חסרים נתונים חשובים: למשל, האם המודל טעה יותר באבחון קשישים, מטופלים שאינם דוברי אותה שפה, או קבוצות אחרות שעלולות להיות מיוצגות פחות במאגרי המידע.
הסוגיה המשפטית לא פחות מורכבת. אם מערכת בינה מלאכותית מציעה אבחנה שגויה, מי אחראי: הרופא, בית החולים, חברת הטכנולוגיה או הגוף שאישר את השימוש במערכת? לפי ד"ר רודמן, כיום אין מסגרת רשמית וברורה לאחריות במקרים כאלה. בתוך כך הוא הדגיש נקודה בסיסית ברפואה: מטופלים עדיין רוצים שבני אדם ילוו אותם בהחלטות של חיים ומוות, במיוחד כשמדובר בבשורות קשות, בטיפולים מורכבים או בהחלטות בסוף החיים.
המשמעות המעשית של המחקר, לפחות בשלב זה, היא לא חדר מיון ללא רופאים, אלא חדר מיון שבו רופאים עשויים לקבל חוות דעת נוספת ממערכת חכמה. כלי כזה יכול להזכיר אבחנות נדירות, להפחית החמצות, לסייע לרופאים צעירים, לקצר תהליכי חשיבה ולתמוך בעומסי המיון. אבל הוא לא יכול להחליף בדיקה גופנית, אחריות מקצועית, שיחה עם משפחה, אמפתיה או שיקול דעת אנושי במצב של אי ודאות.