SEMO: یه مدل باحال برای مدیریت روابط تو شبکه‌های اجتماعی (خودمونیش یعنی چطور دوستامون رو انتخاب کنیم!)

خب بذار خیلی راحت بگم این مقاله چی می‌خواد بگه! اسم مدلش SEMO هست، که یه سیستم کاملاً جدید و جالب برا مدیریت روابط اجتماعی تو شبکه‌های پویا ارائه داده. معنی «شبکه اجتماعی پویا» میشه همون جایی که آدما مدام دارن دوست جدید پیدا می‌کنن یا بعضیا رو کنار می‌ذارن – یعنی همون شبکه‌ای که همیشه همه توش نباشن یا روابطشون ثابت نمیشه.

حالا این مدل با یه ایده خفن اومده جلو: اومدن رفتار آدما رو شبیه‌سازی کردن که وقتی نمی‌دونن دقیقاً چی کار باید کنن، چطور تصمیم می‌گیرن با کی دوست شن یا چقدر رو دوستای قدیمی حساب کنن. توی علمی به این مسأله میگن “تصمیم‌گیری تحت عدم قطعیت”، یعنی وقتی هنوز مطمئن نیستی چه انتخابی بهتره، باید بین کشف گزینه‌های جدید (مثلاً رفتن سراغ دوستای جدید) و استفاده از روابط فعلی (مثلاً همون دوستای قدیمی) تعادل ایجاد کنی.

حالا اینا این مسأله رو ترکیبی از دو تا مدل معروف علمی دونستن: یکی “Multi-Armed Bandit” یا به اختصار MAB که یعنی ماشین فرضی با چند دسته که هرکدومش یه جایزه احتمالی داره و آدم باید امتحان کنه ببینه کدومش بیشتر برنده‌ش می‌کنه؛ و یکی هم Markov Decision Process یا MDP، که یه مدل ریاضی برای تصمیم‌گیری‌های پیاپی تو شرایط مختلفه. کارشون این بوده که این دوتا رو قاطی کنن تا بفهمن آدم‌ها چطور انتخابای اجتماعی‌شون رو مدیریت می‌کنن.

خیلی راحت بگم، توی مدل SEMO آدم‌ها (که اینجا بهشون میگن «عامل»، همون agent)، باید هی تصمیم بگیرن که مثلاً امسال سراغ دوست‌های تازه برن و فرصتای جدید رو امتحان کنن یا اینکه با دوستای قبلی‌شون بیشتر وقت بذارن و از ارتباطات قدیمیشون بهره ببرن. این همون تعادلی هست که تو هوش مصنوعی بهش میگن “exploration vs exploitation” یعنی کشف کردن یا استفاده کردن – خودمونیش میشه: “دوستای تازه پیدا کنم یا همون قبلیا رو حفظ کنم؟!”

تو این مدل، یه مفهوم جدید بهش میگن “سود اجتماعی تکاملی” یا همون socio-evolutionary fitness تعریف شده. خلاصه‌ش اینه که هرکسی دنبال اینه که از دوستاش بیشترین منفعت رو ببره – چه اطلاعات و حمایتی که خودش می‌گیره و چه چیزایی که به کل شبکه اجتماعی می‌رسه. یعنی هم سود فردی مهمه و هم اینکه شبکه چجوری شکل می‌گیره و رشد می‌کنه.

برای اینکه مدل هوشمند بشه، از یادگیری تقویتی یا همون “Reinforcement Learning” استفاده کردن (یعنی سیستمی که خودش درس می‌گیره با تجربه‌هاش، مثلاً اگه با یه دوست جدید حالش خوب بود، یاد می‌گیره دفعه بعد هم سراغ آدمای مشابه بره!) و همچنین “به‌روزرسانی باور به سبک بیزین” یا همون Bayesian belief updating (یعنی طبق شواهد جدید، نظرش درباره اینکه کی خوبه دوست باشه عوض میشه).

یه الگوریتم مخصوص به اسم Social-UCB تو این سیستم گنجوندن. این “UCB” یعنی Upper-Confidence-Bound – یه راه برای پیدا کردن بهترین انتخاب بین چند گزینه که احتمال بردشون قطعیت نداره. پس Social-UCB یعنی آدم توی شبکه اجتماعی حدس میزنه کدوم دوستا بیشتر براش خوب در میان و هوشمندانه انتخاب می‌کنه.

یه نکته دیگه اینه که توی این مدل، محدودیت مغزی آدما و نصفه‌نصفه منطقی بودنشون رو هم درنظر گرفتن! یعنی قبول کردن که آدم‌ها همه‌چیز تمیز و با حساب‌کتاب سرراست عمل نمی‌کنن و گاهی اشتباهات خاص خودشون رو دارن. این رو تو مدل‌سازی شون لحاظ کردن و اومدن یه سری قانون برای به‌روزرسانی رابطه‌ها درست کردن که شبیه رفتار طبیعی آدم‌ها باشه.

حالا تو آزمایش‌هایی که با این مدل کردن، دیدن که Social-UCB همیشه نسبت به راه‌حل‌های معمولی کارایی بهتری داره. یعنی اونایی که با این مدل روابطشون رو مدیریت می‌کنن، هم رابطه‌های جمعی قوی‌تری می‌سازن هم منفعت اجتماعی شخصی و کلی‌شون بیشتر میشه. اینو با مدل‌های معمول مقایسه کردن و حتی نمودار و جدول درست کردن که نشون بده شبکه چطور رشد می‌کنه و آدم‌ها چطور سود می‌برن.

در کل، SEMO داره یه پل جدید می‌زنه بین سه تا حوزه: کشف و بهره‌برداری (exploration/exploitation)، تکامل شبکه‌های اجتماعی و یادگیری اجتماعی. یعنی با این مدل هم می‌فهمیم آدم‌ها چطور روابط‌شون رو می‌سازن و حفظ می‌کنن، هم یه ابزار باحال و علمی برای شبیه‌سازی و تحلیل رفتار واقعی آدم‌ها تو دنیای اجتماع بهمون می‌ده. خلاصه‌ش اگه دنبال اینی بفهمی علوم کامپیوتر و هوش مصنوعی چطور می‌تونه روابط اجتماعی رو مدل کنه، SEMO یه نمونه دقیق و آینده‌داره!

منبع: +