ببین دوست من، امروزه شایعات و اطلاعات غلط درباره دخانیات (مثلاً سیگار و قلیون و اینا) مثل قارچ تو اینترنت زیاد شدن و این موضوع میتونه سلامت کلی آدمها رو حسابی تهدید کنه. تا حالا کار بررسی و راستودروغ درآوردن این حرفها دست آدمها بود و خب، زمانبر و خیلی طاقتفرسا بود. مگه میشه با سرعت پخش شایعات آنلاین رقابت کرد؟ واقعاً نه!
اما حالا یه تیم باهوش اومدن یه سیستم مبتنی بر هوش مصنوعی (همون هوش مصنوعی که خودش یاد میگیره و فکر میکنه!) ساختن که میتونه اتوماتیک راست و دروغ مطالب مربوط به دخانیات رو بررسی کنه. این پروژه به نوعی یه تست اثبات ایده (Proof-of-concept) بوده، یعنی هنوز خیلی بزرگ پیادهسازیش نکردن، اما نشون دادن که کار میکنه.
حالا سیستمشون چجوری کار میکنه؟ بیخیال واژههای سنگین بشیم: اینجا با ترکیب سه عامل اصلی (که دقیقاً بهش میگن multi-agent pipeline، یعنی چندتا عامل هوشمند که با هم همکاری میکنند) ساخته شده. اصل ماجرا اینه:
۱. از GPT-4.1 استفاده کردن (یه مدل خیلی پیشرفته از چتباتهای OpenAI که کلی چیز حالیش هست و آدم رو حسابی سورپرایز میکنه!).
۲. برای سرچ آنی مطالب واقعی و معتبر از API به اسم Serper استفاده میشه. API یعنی راهی که سیستم بتونه به سرورها و اطلاعات آنلاین وصل بشه و جواب بگیره.
۳. کل ماجرا رو با Crewai پیش بردن (Crewai یه فریمورک یا چارچوبیه که همکاری چندتا عامل هوشمند رو ممکن میکنه).
حالا این سه عامل هر کدوم یه کار انجام میدن: اولی (Content Analyzer) ادعاها رو دستهبندی میکنه به چهار نوع:
- اثر روی سلامتی
- ادعای علمی
- سیاست مربوط به دخانیات
- آمار و ارقام
دومی (Scientific Fact Verifier) میره سراغ منابع معتبر مثل WHO (سازمان بهداشت جهانی)، CDC (مرکز کنترل بیماریها)، PubMed Central (مرجع مقالات علمی پزشکی)، و Cochrane (یک پایگاه داده خیلی معتبر بررسی علمی) تا مطمئن شه اطلاعات درسته یا نه.
سومی (Health Evidence Assessor) میاد یه نمره به ادعا میده بین صفر تا صد و اون رو توی پنج دسته میذاره؛ یعنی یه سیستمی ساخته شده که با چندتا معیار مختلف و با دقت بالا، هر حرف رو بررسی میکنه و میگه واقعاً چقدر قابلیت باور داره.
نتایج چی شد؟
- اختلاف میانگین نمره سیستم با کارشناسان فقط ۶.۲۵ تا بود (MAE: میانگین اختلاف绝对 که یعنی چقدر رای ماشین با رای آدمها فرق داشت). خیلی خوبه!
- توافق بین سیستم و کارشناسان هم به صورت عددی زیاد بوده (وزنی شده Cohen’s κ= ۰.۶۸، که نشوندهنده “توافق قابلتوجه“ هست). اگر این عدد رو نمیدونی، بگم بالای ۰.۶ یعنی واقعاً دارن خوب با هم هماهنگ کار میکنن.
- تو ۷۰ درصد موارد دقیقاً مثل کارشناسها تصمیم گرفته و توی ۹۵ درصد یکی کنار هم بودن (یعنی شاید دقیقاً یک دسته فرق کرده، اما دور نبوده).
- هر بررسی کمتر از ۷ ثانیه طول کشید! یعنی هزار برابر سریعتر از روش دستی تخصصی که هر مورد ۲ تا ۴ ساعت وقت میبره!
البته محدودیتهایی هم داشتن:
- تست فقط روی ۲۰ ادعای مختلف انجام شده و کارشناسان برای هر مورد کلی وقت گذاشتن تا سیستم رو کالیبره کنن. کالیبره کردن هم یعنی ورداشتن و سیستم رو با واقعیت تطبیق دادن تا دقتش بهتر شه.
- سیستم کمی محافظهکار بوده، یعنی ۳.۲۵ نمره بالاتر از کارشناسها به مطالب داده. تو دو تا مورد که کارشناسان گفتن کاملاً غلطه (“خیلی غیرمحتمل“)، این سیستم هیچکدوم رو تو این دسته خیلی پایین قرار نداد.
جمعبندی: این کار فعلاً یه نمونه آزمایشی بود که نشون داد فناوری واقعاً برای بررسی سریع اطلاعات غلط درباره دخانیات جواب میده، فقط باید کمی بهترش کنن و در سطح وسیعتر تستش کنن. این سیستم هم سریعتره، هم با شفافیت و منطق عمل میکنه، هم خیلی خوب با نظر کارشناسان هماهنگه! اگر این کارها توسعه پیدا کنه، میتونیم امیدوار باشیم روز به روز کمتر فریب شایعات اینترنتی درباره سیگار و دخانیات رو بخوریم.
خلاصه که هوش مصنوعی داره میاد کمکمون سر سلامت و نبرد با شایعات؛ واقعاً وقتشه کلاس درس رو بدن دست رباتها! 😉
منبع: +