یه روش باحال و خودیادگیر برای تشخیص اخبار فیک با متن و عکس!

خب، بذار راحت و روون براتون توضیح بدم که توی این مقاله دقیقاً چه اتفاقی افتاده و اون روش جدید چیه که گفتن خیلی خوب می‌تونن اخبار جعلی رو شناسایی کنه.

این روزا شبکه‌های اجتماعی مثل بمب اطلاعات عمل می‌کنن! اینقدر خبر توی اینترنت و شبکه‌ها می‌چرخونه که دیگه کسی نمی‌دونه چی واقعیه و چی دروغ. متأسفانه، زیاد شدن این خبرها باعث شده حجم اخبار فیک یا همون جعلی هم بره بالا، و خب این موضوع قشنگ دردسره.

راستش، محقق‌ها قبل‌ترم سعی کردن با روش‌های یادگیری ماشین (Machine Learning، یعنی همون الگوریتم‌هایی که خودشون از داده یاد می‌گیرن) جلوی انتشار اخبار تقلبی رو بگیرن. اما مشکل اصلی چی بوده؟ دیتای برچسب‌خورده یا همون خبرهایی که دقیقاً مشخصه فیکن یا نه، خیلی کمه! یعنی کلی خبر هست، ولی معلوم نیست واقعیه یا نه تا الگوریتم‌ها روش کار کنن.

حالا جالبش اینجاست که اخبار فیک فقط به متن محدود نیست! خیلی وقتا یه مقاله یا تیتر خبری، کنار متنش عکس هم می‌ذارن تا بیشتر واقعی به نظر برسه. اینجاست که تشخیص فیک بودن کار دوبرابر سخت میشه چون باید هم نوشته رو بفهمی، هم عکس رو تحلیل کنی.

توی این مقاله یه مدل جدید معرفی کردن که خودیادگیر (Self-learning) و چندرسانه‌ای (Multimodal) هست. چندرسانه‌ای یعنی همزمان می‌تونه هم متن و هم عکس رو بررسی کنه. این مدل، برای شناسایی خبر فیک از یه تکنیک خفن و نسبتاً جدید به اسم “یادگیری مقابله‌ای” یا Contrative Learning استفاده میکنه. این روش خیلی باحاله چون لازم نداره بهش بگی کدوم داده فیکه و کدوم نه؛ خودش می‌تونه از فرق‌های واقعی بین داده‌ها یاد بگیره.

حالا یه نکته باحال دیگه اینه که این مدل جدید، رفته سراغ LLM ها (Large Language Models، یعنی مدل‌های زبانی بزرگی که کلی متن خوندن! مثلاً چت‌جی‌پی‌تی هم یه چرخش از همین دسته است)، تا به صورت همزمان بتونه نوشته‌ها و عکس‌ها رو تحلیل کنه. چون این مدل‌ها کلی زبان و متن توی عمرشون دیدن و می‌تونن مفاهیم و ترفندهای زبانی خبر فیک رو دربیارن.

نتایج آزمایشاشون چی نشون داد؟ با یه دیتاست عمومی (یعنی داده‌هایی که همه می‌تونن ازش استفاده کنن) تست کردن و مدلشون تونسته بالای ۸۵٪ هم دقت (accuracy)، هم precision (که یعنی چقدر جوابای مثبتش واقعا فیک بودن)، هم recall (که یعنی چند درصد کل خبرای فیک رو پیدا کرده)، و F1-score (یه جور معدل از precision و recall که نشون می‌ده مدل چقدر خوبه) بگیره. این یعنی جداً تو کار تشخیص اخبار فیک از بقیه روش‌های معروف الان تو بازار بهتر عمل کرده.

در آخر، مقاله تاکید می‌کنه که این مدل باحال و جمع‌وجورش، کلی به شناسایی خودکار اخبار جعلی تو کانال‌های مختلف کمک می‌کنه—مخصوصاً اونایی که هم متن دارن و هم عکس (چندرسانه‌ای!). خلاصه اگه شما هم از شایعه‌های آنلاین و خبرای تقلبی خسته شدین، دونستن این که هوش مصنوعی داره قوی‌تر میشه تا جلوش رو بگیره، می‌تونه حسابی امیدوارکننده باشه!

منبع: +