خب بچهها، بذارین امروز در مورد یه موضوع باحال و جدید تو دنیای رباتهای ازدحامی (یعنی کلی ربات کوچیک که باهم کار میکنن) براتون توضیح بدم. این مقاله که تازه اومده، یه ایده جذاب رو وسط کشیده: استفاده از یادگیری هبی (Hebbian Learning) تو کنترل رباتهای ازدحامی، اونم جوری که خودش، بدون دخالت بیرونی، بین رباتا تفاوت یا به اصطلاح «ناهمگنی» ایجاد میکنه.
حالا یادگیری هبی چیه؟ یه جور یادگیری الهامگرفته از مغز و نورونهاست. یعنی بچههای دانشمند از مغز آدم ایده گرفتن، چون تو مغز وقتی دو نورون باهم همزمان فعال میشن، اتصال بینشون قویتر میشه. دقیقاً مثل این قانون: «نورونهایی که باهم فعال میشن، باهم میمونن» یا اصطلاحاً “cells that fire together, wire together”. اینو گذاشتن تو دل یه شبکه عصبی واسه رباتها.
نکته باحال اینه که این یادگیری فقط با اطلاعات محلی کار میکنه. یعنی هر ربات فقط اونچیزی رو که خودش و همسایههاش حس میکنن برای یادگیری استفاده میکنه، لازم نیست کل یه نقشه از همه چی داشته باشه. این ویژگی باعث شده یکی از مشکلهای بزرگ این حوزه (که بهش میگن مشکل micro-macro، یعنی اینکه رفتار گروه رو فقط با نگاه کردن به یه ربات متوجه نمیشی) حل بشه. هر ربات طبق قانون ساده خودش یاد میگیره، پس دیگه دنبال اینکه تقصیر کیه و رفتار پیچیدهی کل گروه از کجا اومده لازم نیست بگردیم.
حالا این مقاله سه تا موضوع مهم رو پوشش داده:
-
یادگیری هبی کلی قوانین یادگیری رو توی همه اعضای گروه یکی نگه میداره، پس وقتی گروه بزرگ میشه، دیگه مجبور نیستیم پارامترای خیلی زیادی تنظیم کنیم. مشکل زیادشدن ابعاد یا به اصطلاح “curse of dimensionality” که موقع بزرگ شدن گروه پیش میاد خیلی کمتر میشه.
-
به خاطر اینکه قوانین یادگیری رو طبق رفتار کل گروه توسعه میدن، دیگه نیاز نمیشه که کلی دانش قبلی راجع به اینکه چه پارامترا یا ترکیبهایی برای هر ربات لازمه داشته باشیم. قبلاً هر ربات باید جداگونه تنظیم میشد، اما حالا به صورت طبیعی خودشون متفاوت میشن و نیاز به آزمون و خطاهای طولانی یا طراحی دستی نیست.
-
اون چیزی که این مدل یادگیری رو باحالتر میکنه اینه که برخلاف روشهای معروف مثل Multi Agent Reinforcement Learning (یعنی یادگیری تقویتی چند عامله، یه تکنیک پیشرفته برای یادگیری گروهی)، شما میتونین فقط با قوانینی که از رفتار کل گروه نتیجه میگیرین، همون کار رو حتی راحتتر انجام بدین.
در نهایت، طبق نتایج مقاله نشون داده شد که وقتی رباتهای ازدحامی با یادگیری هبی کار میکنن، خودشون به شکل طبیعی رفتارشون رو تغییر میدن و بین نقشهای مختلف تو گروه جابجا میشن. این باعث میشه کل گروه عملکردش خیلی خیلی بهتر بشه و گروه بتونه با چالشهای متنوعتری کنار بیاد.
خلاصه که اگه بخوام راحت و رفاقتی بگم، این مدل یادگیری باعث میشه رباتها نه تنها مثل هم نباشن، بلکه هرکدوم خودشون با توجه به شرایط و با کمترین اطلاعات بیرونی، نقش خودشون رو پیدا کنن. به نظرم واقعاً ایده خلاقانه و کار راهاندازی برای دنیای رباتهای هوشمنده!
منبع: +