امروز میخوام درباره یه مقاله خفن و جدید باهاتون حرف بزنم که کلی روش بازی مسترمایند رو زیر و رو کرده! اگه بازی مسترمایند رو نمیشناسین، همون بازی معروف رمزگشاییه که باید با سوال و جواب، رمز طرف مقابل رو پیدا کنی.
حالا اصل قضیه اینه که تو این مقاله یه سری استراتژی جدید و خیلی علمی برای پیدا کردن رمز تو مسترمایند معرفی شده که با استفاده از یه مفهوم به اسم “آنتروپی وزنی” (که الان توضیح میدم چیه) تونسته بهترین رکوردهایی که تا الان تو حالتهای هوشمندانه برای این بازی بوده رو بزنه!
اول بگم آنتروپی چیه: آنتروپی یه جور ابزار آماریه که مثلا نشون میده یه مجموعه اطلاعات چقدر غیرقابل پیشبینی یا بهاصطلاح بینظم هست. مثلاً هر چی آنتروپی بیشتر باشه یعنی اطلاعات پخشتر و مبهمتره. حالا اینجا نویسنده ها اومدن یه کار جالب کردن و به هر نوع بازخورد تو بازی مسترمایند وزنی دادن؛ یعنی بسته به شرایط بازی، هر بازخورد یه ارزش مخصوص خودش رو میگیره. به این میگن آنتروپی وزنی!
یه اسم دیگه هم اینجا هست: Belis-Guia’s u framework. اینم یه مدل ریاضی-آماریه که به طور خلاصه کمک میکنه ارزش هر بازخورد رو تو هر لحظه بازی بفهمین.
نویسندهها با کمک الگوریتم ژنتیک (یعنی یه روش یادگیری کامپیوتری که بر اساس تکامل و انتخاب طبیعی کار میکنه)، تونستن بهترین وزنها رو واسه هر بازخورد پیدا کنن. همه این وزنها قابل فهم و منطقی هستن و نشون میدن توی هر موقعیت از بازی، کدوم سوال پرسیدنت بهتره.
حالا نتیجه این شد: با یه بردار ثابت از این وزنهای بهینه، تونستن به طور میانگین توی ۴.۳۵۶۵ حرکت رمز رو پیدا کنن؛ و بیشترین تعداد حرکت هم فقط ۵ بوده، که واقعا فوقالعادهست!
ولی این پایان ماجرا نبود! نویسندهها سطح کار رو بالاتر بردن و اومدن واسه هر دور از بازی یه سری وزن مخصوص درست کردن (یعنی بسته به نوبت، ارزش هر نوع بازخورد فرق میکنه). با این کار به رکورد میانگین ۴.۳۴۸۸ حرکت رسیدن و فقط تو بدترین حالت ممکن بود به ۶ حرکت برسن. این نزدیکترین عملکرد به اون حالت آرمانی تئوریه که ۴.۳۴۰۳ حرکت بوده و فقط کمتر از ۰.۲٪ اختلاف داره!
خوبی این روش اینه که همون سرعت الگوریتمهای کلاسیک رو حفظ کرده (یعنی سریع و کاربردیه)، ولی به خاطر استفاده از همین ارزشگذاریهای با اصول اطلاعاتی، کاراییش کلی بهتر شده.
یه نکته مهمم اینه که تو مقاله، همه تنظیمات و پارامترهای بهینهسازی شده رو گذاشتن که هر کسی بخواد، میتونه خودش کامل امتحانش کنه و نتیجه بگیره (این یعنی reproducibility یا قابلیت تکرار تجربی، که توی علم خیلی مهمه!).
پس اگه دنبال یه استراتژی جدی و تست شده برای مسترمایند میگردین، این مقاله با آنتروپی وزنی و الگوریتم ژنتیک واقعا پیشنهاد میشه. هم علمی و هم کارآمد و هم حسابی باحال!
منبع: +