هوش مصنوعی و بررسیش توی تحقیقات چشم صورتی: کل‌کل ChatGPT، DeepSeek و Claude!

اگه دنبال این بودین بفهمین هوش مصنوعی واقعاً چقدر می‌تونه توی مسائل پزشکی مثل تشخیص بیماری چشم صورتی (همون conjunctivitis که باعث قرمزی و ناراحتی چشم میشه) کمک کنه، این مقاله همونه که باید بخونین! قراره خیلی راحت و دوستانه براتون توضیح بدم چطور مدل‌های زبانی معروف مثل ChatGPT و DeepSeek و حتی Claude توی این حوزه عملکرد داشتن.

اول از همه، لازم بدونید که “مدل‌های زبانی بزرگ” یا LLMها (Large Language Models) همون هوش مصنوعی‌هایی هستن که بلدن با زبان طبیعی یعنی همون حرف زدن یا نوشتن ما آدما ور برن و جواب بدن. ChatGPT و DeepSeek هم از همین مدل‌ها هستن که تو این تحقیق اومدن به دادمون برسن تا ببینیم چقدر توی فهم و جواب دادن به سوالات پزشکی مخصوصاً درباره چشم صورتی خوب عمل می‌کنن.

روش کارشون چطوری بود؟ خیلی ساده، به این مدل‌ها مجموعه‌ای از سوالات مربوط به چشم صورتی رو دادن و دیدن هرکدوم چی جواب میدن. حتی پا رو فراتر گذاشتن و براشون عکس هم نشون دادن که ببینن آیا هوش مصنوعی‌ها از روی تصویر هم می‌تونن تشخیص بدن مشکل چیه یا نه. این قسمت رو بهش می‌گن “تحلیل حساسیت” که یعنی تست کردن مدل‌ها زیر شرایط و سوالات مختلف. تازه، با تکنیکای خفن مثل “prompt engineering” (یعنی هنرمندانه سوال‌پرسیدن از هوش مصنوعی!) تونستن ازشون بهترین جواب‌ها رو بیرون بکشن.

نتایجش چی شد؟ خب، DeepSeek واقعاً تونست اطلاعات خیلی دقیق و تخصصی رو درباره‌ی چشم صورتی بده. یعنی همون چیزی که یه متخصص دکتر چشم می‌خواد! توضیحاتش عمیق‌تر و پر از جزئیاته. در مقابل، ChatGPT بیشتر به درد توضیح دادن کلی و عمومی ماجرا می‌خوره و بیشتر واسه گفتگوی روزمره با مردم عادی خوبه تا بحث علمی خیلی تخصصی.

از نظر خطا چی؟ اینجا یه اصطلاح جذاب داریم به اسم “هَلوسینِیشن ریت” یا “نرخ توهم”! یعنی درصدی از جواباشون رو اشتباه یا الکی تحویل می‌دن. هرچی این عدد کمتر باشه، یعنی مدل دقیق‌تره و اطلاعاتش صحت داره. توی این تحقیق DeepSeek فقط ۷ درصد اشتباه داشت، ولی ChatGPT تقریباً دو برابرش یعنی ۱۳ درصد خطا داشت. این خودش نشون می‌ده DeepSeek توی ارائه اطلاعات پزشکی موثق، قابل اعتمادتره.

یه نکته جالب دیگه: مدل Claude اومده تو بخش تشخیص‌های دو گزینه‌ای یعنی “باینری کلسفیکشن” (یعنی اینکه فقط جوابش آره یا نه باشه)، ۱۰۰٪ درست جواب داده! ChatGPT تو همین تست فقط ۶۲.۵٪ موفق بوده. یعنی Claude قشنگ ترکونده اینجا!

حالا برگردیم سر موضوع تحلیل تصویر چشم: DeepSeek وقتی خواستن بصری و با استفاده از عکس‌های چشم صورتی بهش وظیفه بدن، دیگه اون دقت و عملکرد خوبش رو از دست داد یا حداقل به خوبی قسمت متنی‌اش نبود. کلاً نشون داد که هنوز مدل‌های هوش مصنوعی توی تشخیص تصویری بیماری‌ها یه کم جا دارن تا بهتر بشن.

در کل، اگه از این مدل‌ها توی حوزه پزشکی و مخصوصاً درباره چشم صورتی می‌خواید استفاده کنید، باید بدونید هرکدوم نقطه ضعف و قوت خودش رو دارن. DeepSeek بیشتر به درد تخصصی می‌خوره، ChatGPT برای بحثای عمومی خوبه، و Claude تو تشخیصای دوگزینه‌ای حسابی قابل اعتماده. همه اینا برای دانشجوها و پزشکا می‌تونه راهنما باشه که کدوم مدل رو کجا استفاده کنن.

خلاصه که دنیای هوش مصنوعی وارد پزشکی شده و با این کل‌کل‌ مدل‌ها قراره روز به روز همه چیز دقیق‌تر و حرفه‌ای‌تر پیش بره. ولی فعلاً تا رسیدن به یه دستیار نمونه پزشکی که هیچ خطایی نداشته باشه، هنوز یه کم راه داریم!

منبع: +