چطور هوش مصنوعی داره زرنگ‌تر از همیشه شایعات تنباکو رو رو می‌کنه!

ببین دوست من، امروزه شایعات و اطلاعات غلط درباره دخانیات (مثلاً سیگار و قلیون و اینا) مثل قارچ تو اینترنت زیاد شدن و این موضوع می‌تونه سلامت کلی آدم‌ها رو حسابی تهدید کنه. تا حالا کار بررسی و راست‌و‌دروغ درآوردن این حرف‌ها دست آدم‌ها بود و خب، زمان‌بر و خیلی طاقت‌فرسا بود. مگه میشه با سرعت پخش شایعات آنلاین رقابت کرد؟ واقعاً نه!

اما حالا یه تیم باهوش اومدن یه سیستم مبتنی بر هوش مصنوعی (همون هوش مصنوعی که خودش یاد می‌گیره و فکر می‌کنه!) ساختن که می‌تونه اتوماتیک راست و دروغ مطالب مربوط به دخانیات رو بررسی کنه. این پروژه به نوعی یه تست اثبات ایده (Proof-of-concept) بوده، یعنی هنوز خیلی بزرگ پیاده‌سازیش نکردن، اما نشون دادن که کار میکنه.

حالا سیستمشون چجوری کار میکنه؟ بیخیال واژه‌های سنگین بشیم: اینجا با ترکیب سه عامل اصلی (که دقیقاً بهش میگن multi-agent pipeline، یعنی چندتا عامل هوشمند که با هم همکاری می‌کنند) ساخته شده. اصل ماجرا اینه:

۱. از GPT-4.1 استفاده کردن (یه مدل خیلی پیشرفته از چت‌بات‌های OpenAI که کلی چیز حالیش هست و آدم رو حسابی سورپرایز میکنه!).
۲. برای سرچ آنی مطالب واقعی و معتبر از API به اسم Serper استفاده میشه. API یعنی راهی که سیستم بتونه به سرورها و اطلاعات آنلاین وصل بشه و جواب بگیره.
۳. کل ماجرا رو با Crewai پیش بردن (Crewai یه فریم‌ورک یا چارچوبیه که همکاری چندتا عامل هوشمند رو ممکن می‌کنه).

حالا این سه عامل هر کدوم یه کار انجام میدن: اولی (Content Analyzer) ادعاها رو دسته‌بندی میکنه به چهار نوع:

  • اثر روی سلامتی
  • ادعای علمی
  • سیاست مربوط به دخانیات
  • آمار و ارقام

دومی (Scientific Fact Verifier) میره سراغ منابع معتبر مثل WHO (سازمان بهداشت جهانی)، CDC (مرکز کنترل بیماری‌ها)، PubMed Central (مرجع مقالات علمی پزشکی)، و Cochrane (یک پایگاه داده خیلی معتبر بررسی علمی) تا مطمئن شه اطلاعات درسته یا نه.

سومی (Health Evidence Assessor) میاد یه نمره به ادعا میده بین صفر تا صد و اون رو توی پنج دسته میذاره؛ یعنی یه سیستمی ساخته شده که با چندتا معیار مختلف و با دقت بالا، هر حرف رو بررسی میکنه و میگه واقعاً چقدر قابلیت باور داره.

نتایج چی شد؟

  • اختلاف میانگین نمره سیستم با کارشناسان فقط ۶.۲۵ تا بود (MAE: میانگین اختلاف绝对 که یعنی چقدر رای ماشین با رای آدم‌ها فرق داشت). خیلی خوبه!
  • توافق بین سیستم و کارشناسان هم به صورت عددی زیاد بوده (وزنی شده Cohen’s κ= ۰.۶۸، که نشون‌دهنده “توافق قابل‌توجه“ هست). اگر این عدد رو نمی‌دونی، بگم بالای ۰.۶ یعنی واقعاً دارن خوب با هم هماهنگ کار می‌کنن.
  • تو ۷۰ درصد موارد دقیقاً مثل کارشناس‌ها تصمیم گرفته و توی ۹۵ درصد یکی کنار هم بودن (یعنی شاید دقیقاً یک دسته فرق کرده، اما دور نبوده).
  • هر بررسی کمتر از ۷ ثانیه طول کشید! یعنی هزار برابر سریع‌تر از روش دستی تخصصی که هر مورد ۲ تا ۴ ساعت وقت می‌بره!

البته محدودیت‌هایی هم داشتن:

  • تست فقط روی ۲۰ ادعای مختلف انجام شده و کارشناسان برای هر مورد کلی وقت گذاشتن تا سیستم رو کالیبره کنن. کالیبره کردن هم یعنی ورداشتن و سیستم رو با واقعیت تطبیق دادن تا دقتش بهتر شه.
  • سیستم کمی محافظه‌کار بوده، یعنی ۳.۲۵ نمره بالاتر از کارشناس‌ها به مطالب داده. تو دو تا مورد که کارشناسان گفتن کاملاً غلطه (“خیلی غیرمحتمل“)، این سیستم هیچ‌کدوم رو تو این دسته خیلی پایین قرار نداد.

جمع‌بندی: این کار فعلاً یه نمونه آزمایشی بود که نشون داد فناوری واقعاً برای بررسی سریع اطلاعات غلط درباره دخانیات جواب می‌ده، فقط باید کمی بهترش کنن و در سطح وسیع‌تر تستش کنن. این سیستم هم سریع‌تره، هم با شفافیت و منطق عمل میکنه، هم خیلی خوب با نظر کارشناسان هماهنگه! اگر این کارها توسعه پیدا کنه، می‌تونیم امیدوار باشیم روز به روز کمتر فریب شایعات اینترنتی درباره سیگار و دخانیات رو بخوریم.

خلاصه که هوش مصنوعی داره میاد کمکمون سر سلامت و نبرد با شایعات؛ واقعاً وقتشه کلاس درس رو بدن دست ربات‌ها! 😉

منبع: +