تشخیص اسپمرها با ترفند ویدیوسازی رفتار کاربر: روشی با حال از دنیای پردازش ویدیو!

Fall Back

خب رفقا، بذارین یه موضوع خیلی باحال رو باهاتون درمیون بذارم! می‌دونین تو شبکه‌های اجتماعی مثل توییتر و ویبو، کلی اسپمر هست که همش دنبال فریب دادن الگوریتم‌ها و کاربران هستن؟ یه تیم خفن اومده از تکنولوژی‌هایی که برای دسته‌بندی ویدیو استفاده میشه الهام گرفته و یه مدل جدید برای شناسایی این اسپمرها ساخته. بیاین باهم خیلی راحت و خودمونی این ماجرا رو قشنگ قورت بدیم!

ماجرا از اینجا شروع شد که گفتن: اگه به رفتار کاربرا مثل فریم‌های یه ویدیو نگاه کنیم چی میشه؟ (فریم همون تصاویری هست که وقتی دونه دونه پشت سر هم میان، میشه یه ویدیو.) یعنی اگه رفتار یه کاربر تو بازه‌های زمانی مختلف رو بذاریم کنار هم، مثل اینه که داریم ویدیوش رو نگاه می‌کنیم!

حالا اسم این مدل رو گذاشتن UVSD که مخفف User Videoization-based Spammer Detection هست. یعنی “شناسایی اسپمر براساس ویدیوسازی کاربر”؛ خیلی شیک و باکلاس!

قبلش چیکار کردن؟

  1. الگوریتم user2pixel رو معرفی کردن. این یعنی رفتار یه کاربر رو به یه پیکسل تبدیل می‌کنه. هر کسی مثل یه نقطه کوچیک (پیکسل) تو تصویر فرض میشه و “موضع” یا نوع رفتار اون کاربرم با رنگ اون پیکسل نشون داده میشه (یعنی همون RGB، که تو عکاسی به معنی سه تا رنگ قرمز و سبز و آبی برای ساخت هر رنگیه!).

  2. الگوریتم behavior2image . حالا اونا اومدن و رفتار هر کاربر رو که تو یه زیرمجموعه (یا همون subspace) قرار داره، به یه تصویر تبدیل کردن! این‌کارو با ترفندهای یادگیری بازنمایی یا Representation Learning (یعنی روشی برای خلاصه‌سازی و پیدا کردن ویژگی‌های کلیدی داده‌ها) انجام دادن. بعد با الگوریتم‌های Cutting و Diffusion تصویر نهایی (یا همون فریم) کامل شد، یعنی اطلاعات مختلف کاربرها درست کنار هم چیده شدن.

  3. حالا نوبت ساختن ویدیو از این تصاویری بود که ساختن! با کمک ویژگی‌های زمانی، شروع کردن به کنار هم گذاشتن این فریم‌ها و ازش یه ویدیو ساختن.

قدم آخر ولی خیلی خفن‌تر بود!

اینا اومدن همونطور که کلی برنامه برای دسته‌بندی ویدیو داریم (مثلاً تشخیص اینکه تو یه ویدیو توپ تو فوتباله یا بسکتبال!) از الگوریتم‌های video classification استفاده کردن. یعنی حالا که ویدیوی رفتار هر کاربر رو داشتن، باید تشخیص می‌دادن این طرف اسپمره یا نه!

برای تست هم از دیتاستای عمومی مثل WEIBO و Twitter استفاده کردن (دیتاست یعنی مجموعه داده‌هایی که واسه تست و آموزش مدل‌ها به کار میره). نتیجه‌ها هم خیلی جالب بوده: مدل UVSD تونسته بهتر از مدل‌های قبلی و پیشرفته (state-of-the-art) کار کنه و اسپمرها رو با دقت بالاتری پیدا کنه.

خلاصه اینکه با کمک نگاه ویدیویی به رفتار کاربرا و قاطی کردن این ایده با هوش مصنوعی، حالا میشه اسپمرها رو خیلی دقیق‌تر و باحال‌تر پیدا کرد. اگه آدم خلاق باشیم، کلی ایده از جاهای عجیب (مثل تکنولوژی ویدیو برای حل مشکل اسپم!) میشه گرفت! اینم یه نمونه فوق‌العاده.

منبع: +