چطوری یادگیری مدل ترنسفورمر می‌تونه وای‌فای رو باحال‌تر کنه؟

Fall Back

خب رفقا، امروز میخوام براتون در مورد یه مقاله باحال و جدید از دنیای شبکه و هوش مصنوعی حرف بزنم که مربوط میشه به بهینه‌کردن کار وای‌فای، مخصوصاً بحث CSMA (یعنی همون مدلی که دستگاه‌ها باید با هم هماهنگ شن که کی داده بفرسته، تا سیگنال‌ها هی به هم نخورن).

تا الان، بیشتر وای‌فای‌ها (و مخصوصاً وای‌فای 7) از یه ترفند قدیمی استفاده می‌کردن به اسم “binary exponential backoff”. خلاصه بگم، این یعنی اگر دو نفر همزمان دیتا فرستادن و سیگنال‌شون به هم خورد، هر کدوم برای اینکه مشکل تکرار نشه، یه مدت تصادفی صبر میکنن و بعد دوباره تلاش می‌کنن. حالا اشکالش چیه؟ مشکل اینجا بود که تو دنیای واقعی و مخصوصاً وقتی تعداد دستگاه‌های اطراف، هی عوض میشه، این روش اصلاً بهینه کار نمیکنه و باعث میشه سرعت اینترنت و انتقال داده پایین بیاد.

یه سری مدل هم اومدن که اسمشون هم جالب بود: “non-persistent و p-persistent CSMA”. اینا تقریباً یه جورایی با ریاضی و فرض کردن تعداد دستگاه‌ها (یا همون نودها) سعی میکردن اون صبر کردن یا اصطلاحاً backoff رو بهتر کنن. ولی هنوز چون تخمینشون از نودها دقیق نبود، خیلی وقتا نتیجه ش هم خوب نمی‌شد. مخصوصاً وقتی تعداد دستگاه‌ها تغییر میکنه یا شماره‌شون رو خیلی دقیق نمی‌دونیم.

حالا مقاله‌ای که میخوام براتون تعریف کنم یه ایده خیلی جدید آورده: بیایم از مدل‌های معروف هوش مصنوعی مثل ترنسفورمرها (Transformer) استفاده کنیم. این ترنسفورمرها همون مدل‌هایی هستن که تو هوش مصنوعی زایشی (Generative AI یعنی هوش مصنوعی‌ای که خودش می‌تونه محتوا بسازه مثل ChatGPT) حسابی ترند شدن. اما فرقش چیه؟

تو این مقاله، نویسنده‌ها اومدن با استفاده از یه چیزی به نام “in-context learning” یا خیلی خودمونی “یادگیری توی بستر یا بر اساس موقعیت” روی ترنسفورمرها کار کردن. یعنی مدل هوش مصنوعی، به جای آموزش عادی، با مثال‌هایی که تو همون لحظه همراه با سوال بهش داده میشه، سعی میکنه بفهمه باید چه کار کنه. اینجا هم دانشمندا اومدن یه عالمه داده از مواردی که برخورد (کالیشن) تو فرستادن داده‌ها پیش اومده رو جمع کردن، این مثال‌ها رو به مدل دادن و مدل رو پرسیدن “الان با این اطلاعات، بهترین زمان صبر کردن واسه فرستادن دیتا چیه؟”. این زمان صبر یا همون “contending window threshold (CWT)” هست.

نکته جالب اینجاست که این مدل ترنسفورمر نیازی به دونستن دقیق تعداد نودها نداره. حتی گفتن اگر مثال‌هایی که به مدل میدیم خیلی هم بی‌نقص نباشه (مثلاً یه کم داده اشتباه داشته باشیم)، بازهم مدل می‌تونه عملکردش رو نزدیک به حالت ایده‌آل نگه داره. خلاصه کلیت قضیه اینجوریه که حتی اگه دیتاهای تمرینی مدل کمی اشتباه داشته باشه، باز پیش‌بینی‌ها و کارایی شبکه نزدیک به بهترین حالت باقی میمونه.

برای اینکه ثابت کنن راهشون جواب میده، اومدن تو نرم‌افزاری به اسم NS-3 که واسه شبیه‌سازی شبکه‌هاست، آزمایش کردن و دیدن نتایج خیلی خوبه: مدلشون هم سریع‌تر به جواب می‌رسه (یعنی زودتر رفتار ایده‌آل رو یاد می‌گیره)، هم سرعت انتقال دیتا نزدیک به بهترین وضعیت ممکنه، حتی در شرایطی که تعداد دستگاه‌ها (نودها) مشخص نباشه یا عوض بشه. این یعنی برای شبکه‌های وای‌فای که معمولاً تعداد دستگاه‌های اطراف همیشه ثاب نیست، این روش حسابی کاربردیه.

در کل این مقاله میخواد بگه قدیما به مدل‌های سفت و سخت و فرمولاتیک گیر داده بودیم، ولی حالا با مدل‌های یادگیری قوی مثل ترنسفورمر و یادگیری در بستر مثال، میشه شبکه‌های وای‌فای رو هوشمند، چابک و نزدیک به بهینه کرد، بدون اینکه حتماً همه داده‌های دنیای واقعی رو دقیق بلد باشیم!

منبع: +