פיתוח תרופה חדשה הוא אחד התהליכים הארוכים והיקרים ביותר בעולם הרפואה. הוא מתחיל לעיתים ברעיון ביולוגי קטן, מוטציה, חלבון, מסלול דלקתי או מנגנון תאי, ונמשך שנים של ניסויים, כישלונות, תיקונים ובדיקות בטיחות. רוב התרופות שמתחילות את הדרך במעבדה אינן מגיעות בסופו של דבר למטופלים. בדרך נופלות מולקולות שנראו מבטיחות, מנגנונים שהתבררו כמורכבים מדי, ותוצאות שלא הצליחו לחזור על עצמן בניסויים גדולים.
לתוך השדה הזה מנסה חברת OpenAI להכניס את GPT-Rosalind, מודל ייעודי למדעי החיים. לפי החברה, המודל נועד לסייע לחוקרים במשימות כמו ניתוח ספרות מדעית, בחינת ראיות, פיתוח מולקולות, הבנת מנגנוני מחלה, ניתוח נתונים גנטיים, תכנון ניסויים, פתרון בעיות במעבדה והצלבת מידע בין מחקרים, קבצים ותוצאות ניסוי. מדובר בגרסת מחקר מוקדמת, research preview, שמיועדת בשלב זה לארגונים מורשים בלבד ולא לציבור הרחב.
בניגוד לגרסאות כלליות של ChatGPT, שמיועדות לשיחה, כתיבה, ניתוח טקסט ותכנות במגוון רחב של תחומים, GPT-Rosalind מכוון לעבודה מדעית צרה ומורכבת יותר. הוא אמור להבין לא רק מאמרים רפואיים, אלא גם שאלות בכימיה תרופתית, גנומיקה, ביואינפורמטיקה, ניסויים רטובים, נתוני ריצוף גנטי, תהליכי רגולציה ומודלים ביולוגיים. במילים פשוטות: לא עוד צ'אטבוט שמסכם מאמר, אלא כלי שאמור להשתלב בעבודת המחקר עצמה.
אחת הדוגמאות שמציגה OpenAI ממחישה היטב את הכיוון. המודל התבקש לבחון חבילת נתונים של טיפול גנטי למחלת דושן, מחלת ניוון שרירים קשה בילדים, ולבדוק אם הנתונים מספיקים לתמיכה בבקשה לאישור מואץ. התשובה לא הייתה תשובה שיווקית נלהבת, אלא ניתוח ביקורתי: האם שיטת המדידה באמת מודדת את החלבון שמקורו בטיפול, האם המדד הביולוגי מנבא תועלת קלינית, האם ההשוואה לקבוצת ביקורת חיצונית מספקת, האם קיימות בעיות בטיחות, ומה היה נדרש כדי לשכנע רגולטור ספקן. זו אולי הנקודה החשובה ביותר: הערך של מודל כזה אינו בכך שהוא "מגלה תרופה" בלחיצת כפתור, אלא בכך שהוא עשוי לזהות מוקדם יותר היכן המחקר חלש.
OpenAI מדווחת כי המודל נבחן במדד פנימי בשם LifeSciBench, שנועד לדמות משימות מדעיות בעלות ערך אמיתי, כפי שהוגדרו על ידי מומחים מהאקדמיה ומהתעשייה. המדד כולל תחומים כמו טיפול בראיות, ניתוח נתונים, תכנון ואופטימיזציה, חשיבה מדעית, אימות, תפעול ותקשורת מדעית. לפי החברה, GPT-Rosalind הציג ביצועים טובים יותר ממודלים אחרים במשימות האלה, בעיקר במקומות שבהם נדרשת עבודה רב־שלבית ולא רק שליפת מידע.
גם בכימיה תרופתית מדווחת החברה על יתרון מסוים. בתחום זה נדרשים חוקרים להעריך כיצד שינוי קטן במבנה של מולקולה עשוי להשפיע על יעילותה, רעילותה, ספיגתה בגוף ופירוקה. לפי הנתונים שפורסמו, GPT-Rosalind השיג במדד MedChemBench ציון של 27.5% לעומת 25.1% ל־GPT-5.5, תוך שימוש בפחות משאבי חישוב. אלה אינם נתונים שמצדיקים כותרת על מהפכה מיידית, אך הם כן מצביעים על שיפור בתחום שבו כל החלטה יכולה לחסוך חודשים של עבודה.
בתחום הגנומיקה והביולוגיה הכמותית מציגה OpenAI שיפור מתון נוסף. במדד GeneBench, שבוחן משימות מורכבות כמו בקרת איכות, תכנון ניתוחים, תיקונים סטטיסטיים וניתוח נתונים ביולוגיים גדולים, הגיע GPT-Rosalind לדיוק של 21.6% לעומת 20.4% ב־GPT-5.5, תוך שימוש ב־31% פחות טוקנים. במדד אחר, LabWorkBench, שבחן סיוע לפרוטוקולים אמיתיים במעבדה, דווח על ציון של 63.2% לעומת 55.8% ל־GPT-5.5. גם כאן, המשמעות אינה שהמודל עובד במקום מדען, אלא שהוא עשוי להפוך לכלי עזר יעיל יותר בתוך צוות מחקר.
בצ'אט ג'יפיטי מבהירים שהמודל החדש לא מרפא סרטן, אינו מייצר תרופה מוכנה ואינו קובע טיפול לחולה. הוא גם לא מחליף ניסויים בבעלי חיים, ניסויים בבני אדם, ועדות אתיקה, חברות תרופות או רשויות רגולציה. מה שהוא עשוי לעשות הוא לקצר חלק מהשלבים המוקדמים והמתישים של המחקר: סריקת ספרות, איתור סתירות בראיות, ניתוח נתונים גנטיים, הצעת כיווני ניסוי, זיהוי כשלים בתכנון מחקר והצבעה על מולקולות או מסלולים ביולוגיים שכדאי לבדוק.
במחלות נדירות, למשל, יכול להיות לכך ערך רב. אלה מחלות שבהן לעיתים יש מעט חולים, מעט מחקרים, מעט מומחים ולעיתים גם מעט עניין מסחרי. כלי שמסוגל לחבר בין מוטציה גנטית, חלבון, מסלול ביולוגי ותרופה קיימת או ניסיונית עשוי לעזור לחוקרים להגיע מהר יותר להשערה ששווה בדיקה. באונקולוגיה, שבה ריצוף גנטי של גידולים הפך לחלק מרכזי מהמחקר ומהטיפול, מודלים כאלה עשויים לסייע בזיהוי דפוסים חוזרים, מוטציות מטרה ועמידות לתרופות.
OpenAI מציגה גם חיבור בין המודל לבין כלי עבודה מעשיים לניתוח מידע ביולוגי. בין היתר מוזכרים תוספים למחקר במדעי החיים ולניתוח נתוני NGS, ריצוף גנטי מהדור החדש. הכלים האלה אמורים לאפשר לחוקרים לעבוד עם קבצים, דוחות, גרפים, ניתוחי RNA ותוצרים שניתן לבדוק ולשחזר. זו נקודה מהותית: במדע, תשובה יפה אינה מספיקה. צריך לדעת מאיפה הגיעו הנתונים, מה נעשה בהם, אילו הנחות הונחו בדרך, ואיך מומחה אנושי יכול לבדוק את התוצאה.
למודל החדש תהיה גישה מבוקרת לארגונים שמבצעים מחקר בעל תועלת ציבורית, עם אבטחת מידע, בקרת גישה ופיקוח בטיחותי. בין הגופים המוזכרים בפרסום נמצאת יצרנית זריקות ההרזיה נובו נורדיסק שבוחנת שימוש במודל לצורך ניתוח נתונים מורכבים, זיהוי דפוסים ובדיקת השערות במחקר רפואי.
ההגבלה הזו היא לא רק עניין מסחרי. מודלים מתקדמים במדעי החיים מעוררים גם שאלות בטיחות כבדות. כלי שמסוגל לנתח רצפים גנטיים, מנגנוני מחלה, חלבונים וניסויים ביולוגיים עשוי להועיל מאוד בפיתוח תרופות, בריאות הציבור והיערכות למגפות. מנגד, יכולות ביולוגיות מתקדמות דורשות זהירות, משום ששימוש לא מבוקר בהן עלול להיות מסוכן. לכן החברה מדגישה פיקוח, גישה מדורגת ושימוש בארגונים מהימנים בלבד.