چطور جلوی پیشنهادهای بی‌مزه رو بگیریم؟ راه جدید برای کنترل ریسک تو سیستمای پیشنهاددهنده!

احتمالاً برات پیش اومده که تو شبکه‌های اجتماعی یا یوتیوب و اپلیکیشن‌های شبیه این، هی پیشنهادای عجیبی ببینی که اصلاً نمی‌فهمی چرا دارن بهت نشون میدن! سیستم‌های پیشنهاددهنده (یعنی همون هوش مصنوعی‌هایی که برات فیلم، آهنگ یا پست پیشنهاد میدن) قراره کار رو راحت کنن و دقیقاً اون چیزی که میخوای رو نشونت بدن. ولی قشنگ روشنه که خیلی وقتا نتیجه برعکس میشه! از کلی پست‌های نامربوط و بی‌ربط تا حتی توصیه‌های غیرمفید یا حتی مضر (مثل اطلاعات غلط یا محتواهایی که یه‌جورایی حالتو بد می‌کنه یا باعث افراطی‌گری میشه). همین باعث شده اعتماد کاربرا هم گرفته شه.

واقعیت اینه که این سیستم‌ها بعضی وقتا با اینکه کلی آپشن و تنظیم دارن تا پیشنهادای نامطلوب رو فیلترشون کنی، اما خیلی از اوقات واقعاً خوب عمل نمی‌کنن یا خیلی دیر به رفتار و بازخورد تو واکنش نشون میدن.

حالا توی یه تحقیق جدید، یه تیم باهوش اومدن یه روش ساده و البته جالب رو معرفی کردن که باهاش میشه جلوی این پیشنهادای نامناسب رو خیلی قاطع گرفت. اسم این دغدغه هم “conformal risk control” ـه. خب این یعنی چی؟ ساده‌اش اینکه: لازمه سیستم یه جوری بتونه مطمئن شه ریسک اینکه یه چیزی رو بهت نشون بده که دوست نداری، کمتر بشه و بتونی کنترلش کنی.

حالا روش این بچه‌ها چه فرقی داره؟ اول اینکه، روششون “model-agnostic” ـه؛ یعنی فرقی نداره سیستم پیشنهاددهنده چه مدلی داشته باشه. می‌تونن تو هر سیستمی این راهکار رو به کار بگیرن. دوم اینکه این متد “distribution-free” ـه؛ یعنی نیاز نداره حتماً بدونی داده‌ها چطور پخش شدن یا چه نوعی هستن.

کل کارشون رو هم رو یه اصل ساده پیاده کردن: استفاده از بازخورد دودویی (binary feedback). یعنی مثلاً وقتی یو آر یه چیزی رو دیدی و گفتی “دوست دارم” یا “دوست ندارم”، همین فیدبک دوحالته باعث میشه سیستم بهتر بفهمه چی بهت نشون بده و چیا رو اصلاً سمتت نیاره.

یه مشکل قبلی‌ها این بود که مثلاً اگه سیستم محدودیت بذاره رو تعداد پیشنهادات (یعنی فقط یه تعداد کم رو نشون بده)، ممکنه چیزایی که واقعاً بهت می‌خوره حذف شه. تو این روش، تیم اومده حتی از بازخورد غیرمستقیم هم استفاده کرده! بازخورد غیرمستقیم یعنی چی؟ یعنی مثلاً فقط نگاه کردن یا کلیک کردن روی یه چیزی هم حساب میشه (بدون اینکه شما صراحتاً بگی خوب بود یا بد بود). این باعث میشه هم پیشنهادات زیادتری داشته باشی، هم مطمئن باشی چیز بدی راه پیدا نمی‌کنه تو لیستت.

کلی آزمایش هم روی داده‌های یه پلتفرم پرطرفدار ویدیویی (مثلاً چیزی شبیه یوتیوب) انجام دادن و حسابی جواب داده: یعنی به راحتی میشه تعداد توصیه‌های نامطلوب رو کنترل کرد و از این مزخرفاتی که اعصاب آدمو خورد می‌کنه خلاص شد؛ البته بدون اینکه کار خاص و زمان‌گیری لازم باشه.

خلاصه اگر سیستمای پیشنهاددهنده دارید یا یه توسعه‌دهنده‌اید، برید سراغ کدش تو گیت‌هاب (لینکش هم اینه: https://github.com/geektoni/mitigating-harm-recsys). راحت می‌تونید این مدل رو به هر سیستم پیشنهادی اضافه کنید و تجربه‌ کاربری بهتری بسازید!

در کل این تحقیق نشون میده که با یه سری خلاقیت ساده و بازخورد مستقیم و غیرمستقیم کاربرا، میشه خیلی راحت جلوی کلی پیشنهاد بی‌ربط، اطلاعات نامناسب یا حتی توصیه‌های خطرناک رو گرفت. این یعنی هم کاربرا راضی‌ترن، هم اعتماد به پلتفرم‌ها بیشتر میشه، هم مشکلات جامعه‌ای مثل افراط‌گرایی و اطلاعات نادرست کمتر میشه.

پس دفعه بعدی که یه چیز عجیب دیدی، بدون که از این به بعد امید هست راحت کنترلش کنی! 😉

منبع: +