خب بذار خیلی راحت بگم این مقاله چی میخواد بگه! اسم مدلش SEMO هست، که یه سیستم کاملاً جدید و جالب برا مدیریت روابط اجتماعی تو شبکههای پویا ارائه داده. معنی «شبکه اجتماعی پویا» میشه همون جایی که آدما مدام دارن دوست جدید پیدا میکنن یا بعضیا رو کنار میذارن – یعنی همون شبکهای که همیشه همه توش نباشن یا روابطشون ثابت نمیشه.
حالا این مدل با یه ایده خفن اومده جلو: اومدن رفتار آدما رو شبیهسازی کردن که وقتی نمیدونن دقیقاً چی کار باید کنن، چطور تصمیم میگیرن با کی دوست شن یا چقدر رو دوستای قدیمی حساب کنن. توی علمی به این مسأله میگن “تصمیمگیری تحت عدم قطعیت”، یعنی وقتی هنوز مطمئن نیستی چه انتخابی بهتره، باید بین کشف گزینههای جدید (مثلاً رفتن سراغ دوستای جدید) و استفاده از روابط فعلی (مثلاً همون دوستای قدیمی) تعادل ایجاد کنی.
حالا اینا این مسأله رو ترکیبی از دو تا مدل معروف علمی دونستن: یکی “Multi-Armed Bandit” یا به اختصار MAB که یعنی ماشین فرضی با چند دسته که هرکدومش یه جایزه احتمالی داره و آدم باید امتحان کنه ببینه کدومش بیشتر برندهش میکنه؛ و یکی هم Markov Decision Process یا MDP، که یه مدل ریاضی برای تصمیمگیریهای پیاپی تو شرایط مختلفه. کارشون این بوده که این دوتا رو قاطی کنن تا بفهمن آدمها چطور انتخابای اجتماعیشون رو مدیریت میکنن.
خیلی راحت بگم، توی مدل SEMO آدمها (که اینجا بهشون میگن «عامل»، همون agent)، باید هی تصمیم بگیرن که مثلاً امسال سراغ دوستهای تازه برن و فرصتای جدید رو امتحان کنن یا اینکه با دوستای قبلیشون بیشتر وقت بذارن و از ارتباطات قدیمیشون بهره ببرن. این همون تعادلی هست که تو هوش مصنوعی بهش میگن “exploration vs exploitation” یعنی کشف کردن یا استفاده کردن – خودمونیش میشه: “دوستای تازه پیدا کنم یا همون قبلیا رو حفظ کنم؟!”
تو این مدل، یه مفهوم جدید بهش میگن “سود اجتماعی تکاملی” یا همون socio-evolutionary fitness تعریف شده. خلاصهش اینه که هرکسی دنبال اینه که از دوستاش بیشترین منفعت رو ببره – چه اطلاعات و حمایتی که خودش میگیره و چه چیزایی که به کل شبکه اجتماعی میرسه. یعنی هم سود فردی مهمه و هم اینکه شبکه چجوری شکل میگیره و رشد میکنه.
برای اینکه مدل هوشمند بشه، از یادگیری تقویتی یا همون “Reinforcement Learning” استفاده کردن (یعنی سیستمی که خودش درس میگیره با تجربههاش، مثلاً اگه با یه دوست جدید حالش خوب بود، یاد میگیره دفعه بعد هم سراغ آدمای مشابه بره!) و همچنین “بهروزرسانی باور به سبک بیزین” یا همون Bayesian belief updating (یعنی طبق شواهد جدید، نظرش درباره اینکه کی خوبه دوست باشه عوض میشه).
یه الگوریتم مخصوص به اسم Social-UCB تو این سیستم گنجوندن. این “UCB” یعنی Upper-Confidence-Bound – یه راه برای پیدا کردن بهترین انتخاب بین چند گزینه که احتمال بردشون قطعیت نداره. پس Social-UCB یعنی آدم توی شبکه اجتماعی حدس میزنه کدوم دوستا بیشتر براش خوب در میان و هوشمندانه انتخاب میکنه.
یه نکته دیگه اینه که توی این مدل، محدودیت مغزی آدما و نصفهنصفه منطقی بودنشون رو هم درنظر گرفتن! یعنی قبول کردن که آدمها همهچیز تمیز و با حسابکتاب سرراست عمل نمیکنن و گاهی اشتباهات خاص خودشون رو دارن. این رو تو مدلسازی شون لحاظ کردن و اومدن یه سری قانون برای بهروزرسانی رابطهها درست کردن که شبیه رفتار طبیعی آدمها باشه.
حالا تو آزمایشهایی که با این مدل کردن، دیدن که Social-UCB همیشه نسبت به راهحلهای معمولی کارایی بهتری داره. یعنی اونایی که با این مدل روابطشون رو مدیریت میکنن، هم رابطههای جمعی قویتری میسازن هم منفعت اجتماعی شخصی و کلیشون بیشتر میشه. اینو با مدلهای معمول مقایسه کردن و حتی نمودار و جدول درست کردن که نشون بده شبکه چطور رشد میکنه و آدمها چطور سود میبرن.
در کل، SEMO داره یه پل جدید میزنه بین سه تا حوزه: کشف و بهرهبرداری (exploration/exploitation)، تکامل شبکههای اجتماعی و یادگیری اجتماعی. یعنی با این مدل هم میفهمیم آدمها چطور روابطشون رو میسازن و حفظ میکنن، هم یه ابزار باحال و علمی برای شبیهسازی و تحلیل رفتار واقعی آدمها تو دنیای اجتماع بهمون میده. خلاصهش اگه دنبال اینی بفهمی علوم کامپیوتر و هوش مصنوعی چطور میتونه روابط اجتماعی رو مدل کنه، SEMO یه نمونه دقیق و آیندهداره!
منبع: +