خب رفقا، بذارین یه موضوع خیلی باحال رو باهاتون درمیون بذارم! میدونین تو شبکههای اجتماعی مثل توییتر و ویبو، کلی اسپمر هست که همش دنبال فریب دادن الگوریتمها و کاربران هستن؟ یه تیم خفن اومده از تکنولوژیهایی که برای دستهبندی ویدیو استفاده میشه الهام گرفته و یه مدل جدید برای شناسایی این اسپمرها ساخته. بیاین باهم خیلی راحت و خودمونی این ماجرا رو قشنگ قورت بدیم!
ماجرا از اینجا شروع شد که گفتن: اگه به رفتار کاربرا مثل فریمهای یه ویدیو نگاه کنیم چی میشه؟ (فریم همون تصاویری هست که وقتی دونه دونه پشت سر هم میان، میشه یه ویدیو.) یعنی اگه رفتار یه کاربر تو بازههای زمانی مختلف رو بذاریم کنار هم، مثل اینه که داریم ویدیوش رو نگاه میکنیم!
حالا اسم این مدل رو گذاشتن UVSD که مخفف User Videoization-based Spammer Detection هست. یعنی “شناسایی اسپمر براساس ویدیوسازی کاربر”؛ خیلی شیک و باکلاس!
قبلش چیکار کردن؟
-
الگوریتم user2pixel رو معرفی کردن. این یعنی رفتار یه کاربر رو به یه پیکسل تبدیل میکنه. هر کسی مثل یه نقطه کوچیک (پیکسل) تو تصویر فرض میشه و “موضع” یا نوع رفتار اون کاربرم با رنگ اون پیکسل نشون داده میشه (یعنی همون RGB، که تو عکاسی به معنی سه تا رنگ قرمز و سبز و آبی برای ساخت هر رنگیه!).
-
الگوریتم behavior2image . حالا اونا اومدن و رفتار هر کاربر رو که تو یه زیرمجموعه (یا همون subspace) قرار داره، به یه تصویر تبدیل کردن! اینکارو با ترفندهای یادگیری بازنمایی یا Representation Learning (یعنی روشی برای خلاصهسازی و پیدا کردن ویژگیهای کلیدی دادهها) انجام دادن. بعد با الگوریتمهای Cutting و Diffusion تصویر نهایی (یا همون فریم) کامل شد، یعنی اطلاعات مختلف کاربرها درست کنار هم چیده شدن.
-
حالا نوبت ساختن ویدیو از این تصاویری بود که ساختن! با کمک ویژگیهای زمانی، شروع کردن به کنار هم گذاشتن این فریمها و ازش یه ویدیو ساختن.
قدم آخر ولی خیلی خفنتر بود!
اینا اومدن همونطور که کلی برنامه برای دستهبندی ویدیو داریم (مثلاً تشخیص اینکه تو یه ویدیو توپ تو فوتباله یا بسکتبال!) از الگوریتمهای video classification استفاده کردن. یعنی حالا که ویدیوی رفتار هر کاربر رو داشتن، باید تشخیص میدادن این طرف اسپمره یا نه!
برای تست هم از دیتاستای عمومی مثل WEIBO و Twitter استفاده کردن (دیتاست یعنی مجموعه دادههایی که واسه تست و آموزش مدلها به کار میره). نتیجهها هم خیلی جالب بوده: مدل UVSD تونسته بهتر از مدلهای قبلی و پیشرفته (state-of-the-art) کار کنه و اسپمرها رو با دقت بالاتری پیدا کنه.
خلاصه اینکه با کمک نگاه ویدیویی به رفتار کاربرا و قاطی کردن این ایده با هوش مصنوعی، حالا میشه اسپمرها رو خیلی دقیقتر و باحالتر پیدا کرد. اگه آدم خلاق باشیم، کلی ایده از جاهای عجیب (مثل تکنولوژی ویدیو برای حل مشکل اسپم!) میشه گرفت! اینم یه نمونه فوقالعاده.
منبع: +