تا حالا فکر کردی تو یه شبکه اجتماعی یا هر شبکه پیچیدهای، چه افرادی بیشتر روی بقیه تاثیر میذارن؟ مثلاً اونایی که اگه یه چیزی پست کنن، نصف شبکه خبر دار میشه! پیدا کردن این “گرههای تاثیرگذار” (که همون آدمای کلیدی هستن) خیلی مهمه و کاربردهای خیلی زیادی داره، از بازاریابی گرفته تا مدیریت بحران و حتی تحلیل شبکههای علمی.
حالا اینکه این آدمای تاثیرگذار رو چطوری پیدا کنیم خودش یه چالش بزرگه. بعضی روشها با هوش مصنوعی و یادگیری عمیق (Deep Learning یعنی هوش مصنوعیهایی که مدلهای خیلی پیچیدهای دارن و با حجم زیادی از دادهها کار میکنن) سراغ این کار رفتن. فقط یه مشکل هست: بیشتر این روشا بر اساس دادههای برچسبخورده کار میکنن، یعنی باید بدونیم قبلاً کدوم آدمها تاثیرگذار بودن. ولی واقعیتش اینه که معمولاً اصلاً این اطلاعات وجود نداره!
اینجا بود که یه سری محقق باهوش اومدن یه روش جدید پیشنهاد دادن به اسم ReCC. ببین، ReCC مخفف Regular equivalence-based Contrastive Clustering هست، یعنی خوشهبندی کانتراستیو بر اساس معادل منظم. حالا، کانتراستیو یادگیری (Contrastive Learning) یعنی مدلی که یاد میگیره تفاوتها و شباهتها رو تشخیص بده و مثلا بفهمه دو تا گره به هم شبیهان یا نه. معادل منظم (regular equivalence) هم یه جور معیاره که نشون میده چه گرههایی تو شبکه، نقشهای ساختاری شبیه هم دارن حتی اگه همسایه نباشن.
داستان اینجوریه: ReCC اومده مسئله شناسایی گرههای تاثیرگذار رو بدون هیچ برچسبی بازتعریف کرده. یعنی به جای اینکه منتظر باشه یکی قبلا اینا رو دستهبندی کرده باشه، خودش با یه سیستم خوشهبندی عمیق و خودآموز سراغ مسئله رفته. تفاوت اصلیش هم با بقیه اینه که به جای چندتا الگوریتم سخت و گیجکننده، روی شناسایی شباهتهای ساختاری گرهها کار میکنه.
ReCC اول با استفاده از معیار شباهت معادل منظم (regular equivalence-based similarity، یعنی مقایسه نقش گرهها تو شبکه مثل کارمندایی که تو شرکتای مختلف کارشون شبیه همه باشه) بین گرهها مثبت و منفی درست میکنه تا شبکه بفهمه کی به کی شبیهه. این مکانیسم با لایههای شبکه کانولوشن گرافی (Graph Convolutional Network، یه مدل یادگیری که اطلاعات ساختار گراف رو میگیره و تو بولد کردن ویژگیهای هر گره کمک میکنه) ترکیب شده تا بفهمه کدوم گره مهمتره.
مدل دو تا مرحله داره: مرحله اولش با یه چیزی به اسم network reconstruction loss (یعنی شبکه رو بازسازی کنه و خطاشو کم کنه)، پیشتمرین میشه تا با ساختار کل شبکه آشنا بشه. تو مرحله بعدی، همزمان با خوشهبندی و یادگیری کانتراستیو، مدل بدون نیاز به هیچ برچسبی بیشتر دقت میگیره و تفاوت تاثیرگذارها با بقیه رو پیدا میکنه.
یه نکته باحال اینه که ReCC هم از معیارهای ساختاری شبکه استفاده میکنه، هم از شباهت معادل منظم، و این باعث میشه تصویر بهتری از هر گره بسازه.
در نهایت، محققها نشون دادن روششون از خیلی از مدلها و الگوریتمهای معروف دیگه بهتر عمل میکنه و تو تستهای مختلف هم خوب جواب داده. خلاصه، اگه دنبال پیدا کردن آدمای کلیدی تو یه شبکه بزرگ و پیچیدهای و هیچ برچسب یا داده آمادهای هم نداری، رو ReCC حساب کن!
منبع: +