GPT-4 – מודל שפה מבוסס בינה מלאכותית – נבדק אל מול רופאים בשלבים שונים בקריירה שלהם, כולל רופאים זוטרים ללא התמחות, רופאי עיניים מתמחים ומומחים. לכל אחד מהם הוצגה סדרה של 87 תרחישי מטופל הקשורים לבעיית עיניים ספציפית, והוא התבקש לתת אבחנה או לייעץ על טיפול על ידי בחירה מתוך ארבע אפשרויות.
GPT-4 קיבל ציון טוב יותר באופן משמעותי במבחן מאשר רופאים זוטרים ללא התמחות, אשר דומים לרופאים כלליים ברמת הידע שלהם בעיניים. GPT-4 קיבל ציונים דומים לאלה של רופאי עיניים מתמחים ומומחים – אם כי הרופאים בעלי הביצועים הטובים ביותר קיבלו ציונים גבוהים יותר מהמודל.
החוקרים אומרים כי מודלי שפה גדולים אינם צפויים להחליף אנשי מקצוע בתחום הבריאות, אך יש להם פוטנציאל לשפר את שירותי הבריאות כחלק משילובם בעבודה הקלינית.
הם אומרים כי מודלים מתקדמים של שפה כמו GPT-4 יכולים להיות שימושיים למתן ייעוץ, אבחון וניהול הקשורים לרפואת עיניים במצבים מבוקרים היטב, כמו מיון חולים, או כאשר הגישה לאנשי מקצוע מומחים בתחום הבריאות מוגבלת.
"אנחנו יכולים באופן מציאותי לשלב בינה מלאכותית בעבודה במיון מול חולים עם בעיות עיניים כדי להחליט אילו מקרים הם מקרי חירום שצריכים להיבדק על ידי מומחה באופן מיידי, אילו יכולים להיות מטופלים על ידי רופא משפחה, ואילו אינם זקוקים לטיפול", אמר ד"ר ארון טירונבוקרוסו, המחבר הראשי של המחקר, אותו ביצע בזמן שהיה סטודנט בבית הספר לרפואה קלינית באוניברסיטת קיימברידג '.
הוא הוסיף כי "המודלים יכולים לעקוב אחר אלגוריתמים ברורים שכבר נמצאים בשימוש, ומצאנו כי GPT-4 טוב כמו רופאים מומחים בעיבוד סימפטומים וסימנים עיניים כדי לענות על שאלות טיפוליות מורכבות.