خب، بذار راحت و روون براتون توضیح بدم که توی این مقاله دقیقاً چه اتفاقی افتاده و اون روش جدید چیه که گفتن خیلی خوب میتونن اخبار جعلی رو شناسایی کنه.
این روزا شبکههای اجتماعی مثل بمب اطلاعات عمل میکنن! اینقدر خبر توی اینترنت و شبکهها میچرخونه که دیگه کسی نمیدونه چی واقعیه و چی دروغ. متأسفانه، زیاد شدن این خبرها باعث شده حجم اخبار فیک یا همون جعلی هم بره بالا، و خب این موضوع قشنگ دردسره.
راستش، محققها قبلترم سعی کردن با روشهای یادگیری ماشین (Machine Learning، یعنی همون الگوریتمهایی که خودشون از داده یاد میگیرن) جلوی انتشار اخبار تقلبی رو بگیرن. اما مشکل اصلی چی بوده؟ دیتای برچسبخورده یا همون خبرهایی که دقیقاً مشخصه فیکن یا نه، خیلی کمه! یعنی کلی خبر هست، ولی معلوم نیست واقعیه یا نه تا الگوریتمها روش کار کنن.
حالا جالبش اینجاست که اخبار فیک فقط به متن محدود نیست! خیلی وقتا یه مقاله یا تیتر خبری، کنار متنش عکس هم میذارن تا بیشتر واقعی به نظر برسه. اینجاست که تشخیص فیک بودن کار دوبرابر سخت میشه چون باید هم نوشته رو بفهمی، هم عکس رو تحلیل کنی.
توی این مقاله یه مدل جدید معرفی کردن که خودیادگیر (Self-learning) و چندرسانهای (Multimodal) هست. چندرسانهای یعنی همزمان میتونه هم متن و هم عکس رو بررسی کنه. این مدل، برای شناسایی خبر فیک از یه تکنیک خفن و نسبتاً جدید به اسم “یادگیری مقابلهای” یا Contrative Learning استفاده میکنه. این روش خیلی باحاله چون لازم نداره بهش بگی کدوم داده فیکه و کدوم نه؛ خودش میتونه از فرقهای واقعی بین دادهها یاد بگیره.
حالا یه نکته باحال دیگه اینه که این مدل جدید، رفته سراغ LLM ها (Large Language Models، یعنی مدلهای زبانی بزرگی که کلی متن خوندن! مثلاً چتجیپیتی هم یه چرخش از همین دسته است)، تا به صورت همزمان بتونه نوشتهها و عکسها رو تحلیل کنه. چون این مدلها کلی زبان و متن توی عمرشون دیدن و میتونن مفاهیم و ترفندهای زبانی خبر فیک رو دربیارن.
نتایج آزمایشاشون چی نشون داد؟ با یه دیتاست عمومی (یعنی دادههایی که همه میتونن ازش استفاده کنن) تست کردن و مدلشون تونسته بالای ۸۵٪ هم دقت (accuracy)، هم precision (که یعنی چقدر جوابای مثبتش واقعا فیک بودن)، هم recall (که یعنی چند درصد کل خبرای فیک رو پیدا کرده)، و F1-score (یه جور معدل از precision و recall که نشون میده مدل چقدر خوبه) بگیره. این یعنی جداً تو کار تشخیص اخبار فیک از بقیه روشهای معروف الان تو بازار بهتر عمل کرده.
در آخر، مقاله تاکید میکنه که این مدل باحال و جمعوجورش، کلی به شناسایی خودکار اخبار جعلی تو کانالهای مختلف کمک میکنه—مخصوصاً اونایی که هم متن دارن و هم عکس (چندرسانهای!). خلاصه اگه شما هم از شایعههای آنلاین و خبرای تقلبی خسته شدین، دونستن این که هوش مصنوعی داره قویتر میشه تا جلوش رو بگیره، میتونه حسابی امیدوارکننده باشه!
منبع: +