کشف آدمای تاثیرگذار تو شبکه‌ها با روشی جدید و بی‌دردسر!

تا حالا فکر کردی تو یه شبکه اجتماعی یا هر شبکه پیچیده‌ای، چه افرادی بیشتر روی بقیه تاثیر میذارن؟ مثلاً اونایی که اگه یه چیزی پست کنن، نصف شبکه خبر دار میشه! پیدا کردن این “گره‌های تاثیرگذار” (که همون آدمای کلیدی هستن) خیلی مهمه و کاربردهای خیلی زیادی داره، از بازاریابی گرفته تا مدیریت بحران و حتی تحلیل شبکه‌های علمی.

حالا اینکه این آدمای تاثیرگذار رو چطوری پیدا کنیم خودش یه چالش بزرگه. بعضی روش‌ها با هوش مصنوعی و یادگیری عمیق (Deep Learning یعنی هوش مصنوعی‌هایی که مدل‌های خیلی پیچیده‌ای دارن و با حجم زیادی از داده‌ها کار می‌کنن) سراغ این کار رفتن. فقط یه مشکل هست: بیشتر این روشا بر اساس داده‌های برچسب‌خورده کار میکنن، یعنی باید بدونیم قبلاً کدوم آدم‌ها تاثیرگذار بودن. ولی واقعیتش اینه که معمولاً اصلاً این اطلاعات وجود نداره!

اینجا بود که یه سری محقق باهوش اومدن یه روش جدید پیشنهاد دادن به اسم ReCC. ببین، ReCC مخفف Regular equivalence-based Contrastive Clustering هست، یعنی خوشه‌بندی کانتراستیو بر اساس معادل منظم. حالا، کانتراستیو یادگیری (Contrastive Learning) یعنی مدلی که یاد می‌گیره تفاوت‌ها و شباهت‌ها رو تشخیص بده و مثلا بفهمه دو تا گره به هم شبیه‌ان یا نه. معادل منظم (regular equivalence) هم یه جور معیاره که نشون میده چه گره‌هایی تو شبکه، نقش‌های ساختاری شبیه هم دارن حتی اگه همسایه نباشن.

داستان اینجوریه: ReCC اومده مسئله شناسایی گره‌های تاثیرگذار رو بدون هیچ برچسبی بازتعریف کرده. یعنی به جای اینکه منتظر باشه یکی قبلا اینا رو دسته‌بندی کرده باشه، خودش با یه سیستم خوشه‌بندی عمیق و خودآموز سراغ مسئله رفته. تفاوت اصلیش هم با بقیه اینه که به جای چندتا الگوریتم سخت و گیج‌کننده، روی شناسایی شباهت‌های ساختاری گره‌ها کار میکنه.

ReCC اول با استفاده از معیار شباهت معادل منظم (regular equivalence-based similarity، یعنی مقایسه نقش گره‌ها تو شبکه مثل کارمندایی که تو شرکتای مختلف کارشون شبیه همه باشه) بین گره‌ها مثبت و منفی درست میکنه تا شبکه بفهمه کی به کی شبیهه. این مکانیسم با لایه‌های شبکه کانولوشن گرافی (Graph Convolutional Network، یه مدل یادگیری که اطلاعات ساختار گراف رو میگیره و تو بولد کردن ویژگی‌های هر گره کمک میکنه) ترکیب شده تا بفهمه کدوم گره مهم‌تره.

مدل دو تا مرحله داره: مرحله اولش با یه چیزی به اسم network reconstruction loss (یعنی شبکه رو بازسازی کنه و خطاشو کم کنه)، پیش‌تمرین میشه تا با ساختار کل شبکه آشنا بشه. تو مرحله بعدی، همزمان با خوشه‌بندی و یادگیری کانتراستیو، مدل بدون نیاز به هیچ برچسبی بیشتر دقت می‌گیره و تفاوت تاثیرگذارها با بقیه رو پیدا میکنه.

یه نکته باحال اینه که ReCC هم از معیارهای ساختاری شبکه استفاده میکنه، هم از شباهت معادل منظم، و این باعث میشه تصویر بهتری از هر گره بسازه.

در نهایت، محقق‌ها نشون دادن روششون از خیلی از مدل‌ها و الگوریتم‌های معروف دیگه بهتر عمل میکنه و تو تست‌های مختلف هم خوب جواب داده. خلاصه، اگه دنبال پیدا کردن آدمای کلیدی تو یه شبکه بزرگ و پیچیده‌ای و هیچ برچسب یا داده آماده‌ای هم نداری، رو ReCC حساب کن!

منبع: +