احتمالاً برات پیش اومده که تو شبکههای اجتماعی یا یوتیوب و اپلیکیشنهای شبیه این، هی پیشنهادای عجیبی ببینی که اصلاً نمیفهمی چرا دارن بهت نشون میدن! سیستمهای پیشنهاددهنده (یعنی همون هوش مصنوعیهایی که برات فیلم، آهنگ یا پست پیشنهاد میدن) قراره کار رو راحت کنن و دقیقاً اون چیزی که میخوای رو نشونت بدن. ولی قشنگ روشنه که خیلی وقتا نتیجه برعکس میشه! از کلی پستهای نامربوط و بیربط تا حتی توصیههای غیرمفید یا حتی مضر (مثل اطلاعات غلط یا محتواهایی که یهجورایی حالتو بد میکنه یا باعث افراطیگری میشه). همین باعث شده اعتماد کاربرا هم گرفته شه.
واقعیت اینه که این سیستمها بعضی وقتا با اینکه کلی آپشن و تنظیم دارن تا پیشنهادای نامطلوب رو فیلترشون کنی، اما خیلی از اوقات واقعاً خوب عمل نمیکنن یا خیلی دیر به رفتار و بازخورد تو واکنش نشون میدن.
حالا توی یه تحقیق جدید، یه تیم باهوش اومدن یه روش ساده و البته جالب رو معرفی کردن که باهاش میشه جلوی این پیشنهادای نامناسب رو خیلی قاطع گرفت. اسم این دغدغه هم “conformal risk control” ـه. خب این یعنی چی؟ سادهاش اینکه: لازمه سیستم یه جوری بتونه مطمئن شه ریسک اینکه یه چیزی رو بهت نشون بده که دوست نداری، کمتر بشه و بتونی کنترلش کنی.
حالا روش این بچهها چه فرقی داره؟ اول اینکه، روششون “model-agnostic” ـه؛ یعنی فرقی نداره سیستم پیشنهاددهنده چه مدلی داشته باشه. میتونن تو هر سیستمی این راهکار رو به کار بگیرن. دوم اینکه این متد “distribution-free” ـه؛ یعنی نیاز نداره حتماً بدونی دادهها چطور پخش شدن یا چه نوعی هستن.
کل کارشون رو هم رو یه اصل ساده پیاده کردن: استفاده از بازخورد دودویی (binary feedback). یعنی مثلاً وقتی یو آر یه چیزی رو دیدی و گفتی “دوست دارم” یا “دوست ندارم”، همین فیدبک دوحالته باعث میشه سیستم بهتر بفهمه چی بهت نشون بده و چیا رو اصلاً سمتت نیاره.
یه مشکل قبلیها این بود که مثلاً اگه سیستم محدودیت بذاره رو تعداد پیشنهادات (یعنی فقط یه تعداد کم رو نشون بده)، ممکنه چیزایی که واقعاً بهت میخوره حذف شه. تو این روش، تیم اومده حتی از بازخورد غیرمستقیم هم استفاده کرده! بازخورد غیرمستقیم یعنی چی؟ یعنی مثلاً فقط نگاه کردن یا کلیک کردن روی یه چیزی هم حساب میشه (بدون اینکه شما صراحتاً بگی خوب بود یا بد بود). این باعث میشه هم پیشنهادات زیادتری داشته باشی، هم مطمئن باشی چیز بدی راه پیدا نمیکنه تو لیستت.
کلی آزمایش هم روی دادههای یه پلتفرم پرطرفدار ویدیویی (مثلاً چیزی شبیه یوتیوب) انجام دادن و حسابی جواب داده: یعنی به راحتی میشه تعداد توصیههای نامطلوب رو کنترل کرد و از این مزخرفاتی که اعصاب آدمو خورد میکنه خلاص شد؛ البته بدون اینکه کار خاص و زمانگیری لازم باشه.
خلاصه اگر سیستمای پیشنهاددهنده دارید یا یه توسعهدهندهاید، برید سراغ کدش تو گیتهاب (لینکش هم اینه: https://github.com/geektoni/mitigating-harm-recsys). راحت میتونید این مدل رو به هر سیستم پیشنهادی اضافه کنید و تجربه کاربری بهتری بسازید!
در کل این تحقیق نشون میده که با یه سری خلاقیت ساده و بازخورد مستقیم و غیرمستقیم کاربرا، میشه خیلی راحت جلوی کلی پیشنهاد بیربط، اطلاعات نامناسب یا حتی توصیههای خطرناک رو گرفت. این یعنی هم کاربرا راضیترن، هم اعتماد به پلتفرمها بیشتر میشه، هم مشکلات جامعهای مثل افراطگرایی و اطلاعات نادرست کمتر میشه.
پس دفعه بعدی که یه چیز عجیب دیدی، بدون که از این به بعد امید هست راحت کنترلش کنی! 😉
منبع: +