اگه دنبال این بودین بفهمین هوش مصنوعی واقعاً چقدر میتونه توی مسائل پزشکی مثل تشخیص بیماری چشم صورتی (همون conjunctivitis که باعث قرمزی و ناراحتی چشم میشه) کمک کنه، این مقاله همونه که باید بخونین! قراره خیلی راحت و دوستانه براتون توضیح بدم چطور مدلهای زبانی معروف مثل ChatGPT و DeepSeek و حتی Claude توی این حوزه عملکرد داشتن.
اول از همه، لازم بدونید که “مدلهای زبانی بزرگ” یا LLMها (Large Language Models) همون هوش مصنوعیهایی هستن که بلدن با زبان طبیعی یعنی همون حرف زدن یا نوشتن ما آدما ور برن و جواب بدن. ChatGPT و DeepSeek هم از همین مدلها هستن که تو این تحقیق اومدن به دادمون برسن تا ببینیم چقدر توی فهم و جواب دادن به سوالات پزشکی مخصوصاً درباره چشم صورتی خوب عمل میکنن.
روش کارشون چطوری بود؟ خیلی ساده، به این مدلها مجموعهای از سوالات مربوط به چشم صورتی رو دادن و دیدن هرکدوم چی جواب میدن. حتی پا رو فراتر گذاشتن و براشون عکس هم نشون دادن که ببینن آیا هوش مصنوعیها از روی تصویر هم میتونن تشخیص بدن مشکل چیه یا نه. این قسمت رو بهش میگن “تحلیل حساسیت” که یعنی تست کردن مدلها زیر شرایط و سوالات مختلف. تازه، با تکنیکای خفن مثل “prompt engineering” (یعنی هنرمندانه سوالپرسیدن از هوش مصنوعی!) تونستن ازشون بهترین جوابها رو بیرون بکشن.
نتایجش چی شد؟ خب، DeepSeek واقعاً تونست اطلاعات خیلی دقیق و تخصصی رو دربارهی چشم صورتی بده. یعنی همون چیزی که یه متخصص دکتر چشم میخواد! توضیحاتش عمیقتر و پر از جزئیاته. در مقابل، ChatGPT بیشتر به درد توضیح دادن کلی و عمومی ماجرا میخوره و بیشتر واسه گفتگوی روزمره با مردم عادی خوبه تا بحث علمی خیلی تخصصی.
از نظر خطا چی؟ اینجا یه اصطلاح جذاب داریم به اسم “هَلوسینِیشن ریت” یا “نرخ توهم”! یعنی درصدی از جواباشون رو اشتباه یا الکی تحویل میدن. هرچی این عدد کمتر باشه، یعنی مدل دقیقتره و اطلاعاتش صحت داره. توی این تحقیق DeepSeek فقط ۷ درصد اشتباه داشت، ولی ChatGPT تقریباً دو برابرش یعنی ۱۳ درصد خطا داشت. این خودش نشون میده DeepSeek توی ارائه اطلاعات پزشکی موثق، قابل اعتمادتره.
یه نکته جالب دیگه: مدل Claude اومده تو بخش تشخیصهای دو گزینهای یعنی “باینری کلسفیکشن” (یعنی اینکه فقط جوابش آره یا نه باشه)، ۱۰۰٪ درست جواب داده! ChatGPT تو همین تست فقط ۶۲.۵٪ موفق بوده. یعنی Claude قشنگ ترکونده اینجا!
حالا برگردیم سر موضوع تحلیل تصویر چشم: DeepSeek وقتی خواستن بصری و با استفاده از عکسهای چشم صورتی بهش وظیفه بدن، دیگه اون دقت و عملکرد خوبش رو از دست داد یا حداقل به خوبی قسمت متنیاش نبود. کلاً نشون داد که هنوز مدلهای هوش مصنوعی توی تشخیص تصویری بیماریها یه کم جا دارن تا بهتر بشن.
در کل، اگه از این مدلها توی حوزه پزشکی و مخصوصاً درباره چشم صورتی میخواید استفاده کنید، باید بدونید هرکدوم نقطه ضعف و قوت خودش رو دارن. DeepSeek بیشتر به درد تخصصی میخوره، ChatGPT برای بحثای عمومی خوبه، و Claude تو تشخیصای دوگزینهای حسابی قابل اعتماده. همه اینا برای دانشجوها و پزشکا میتونه راهنما باشه که کدوم مدل رو کجا استفاده کنن.
خلاصه که دنیای هوش مصنوعی وارد پزشکی شده و با این کلکل مدلها قراره روز به روز همه چیز دقیقتر و حرفهایتر پیش بره. ولی فعلاً تا رسیدن به یه دستیار نمونه پزشکی که هیچ خطایی نداشته باشه، هنوز یه کم راه داریم!
منبع: +