ChatGPT הוא צ'אט בוט מבוסס בינה מלאכותית המשתמש במודל למידה עמוקה כדי לזהות דפוסים ויחסים בין מילים בנתוני האימון העצומים שלו, כדי ליצור תגובות אנושיות לפי בקשה. עם זאת, מכיוון שאין מקור לאמת את נתוני האימון שלו, הכלי יכול לייצר תגובות שאינן נכונות עובדתית. הגרסה האחרונה של ChatGPT עברה בחינה של מומחים לרדיולוגיה, המדגישה את הפוטנציאל של מודלי שפה גדולים, אך גם חושפת מגבלות המערערות על האמינות שלהם, על פי שני מחקרים חדשים שפורסמו בכתב עת של האגודה הרדיולוגית של צפון אמריקה.
"השימוש במודלי שפה גדולים כמו ChatGPT מתפוצץ ורק הולך לגדול", אמר המחבר הראשי ראג'ש בהאיאנה, רדיולוג בטן ומוביל בתחום הטכנולוגיה באוניברסיטת הדמיה רפואית טורונטו, בית החולים הכללי של טורונטו בקנדה. "המחקר שלנו מספק תובנה לגבי הביצועים של ChatGPT בהקשר רדיולוגי, ומדגיש את הפוטנציאל המדהים של מודלי שפה גדולים, יחד עם המגבלות הנוכחיות שהופכות אותו ללא אמין".
ChatGPT הוכרז לאחרונה כיישום הצרכני הצומח ביותר בהיסטוריה, וצ'אטבוטים דומים משולבים במנועי חיפוש פופולריים כמו גוגל ובינג שרופאים ומטופלים משתמשים בהם כדי לחפש מידע רפואי, ציין ד"ר בהאיאנה.
כדי להעריך את ביצועיו בשאלות הבחינה ברדיולוגיה ולחקור חוזקות ומגבלות, ד"ר בהאיאנה ועמיתיו בחנו לראשונה את ChatGPT בהתבסס על GPT-3.5, הגרסה הנפוצה ביותר כיום. החוקרים השתמשו ב-150 שאלות אמריקאיות שנועדו להתאים לסגנון, לתוכן ולקושי של בחינות הקולג' המלכותי הקנדי והמועצה האמריקאית לרדיולוגיה.