حالا کی باید کجا باشه؟ ماجرای انتخاب پویا توی O-RAN با یادگیری تقویتی گرافی!

Fall Back

بیا یه نگاهی بندازیم به یه موضوع داغ توی دنیا شبکه‌های موبایل: O-RAN! اصلاً O-RAN چیه؟ همون Open Radio Access Network یعنی یه جور شبکه دسترسی رادیویی که اجزاش جدا از هم هستن و میشه راحت‌تر مدیریت و تغییرشون داد. خلاصه معمولاً تو شبکه‌های سنتی، اینکه هر قابلیت نرم‌افزاری دقیقاً کدوم دستگاه یا مکان انجام بشه، از قبل ثابت و مشخصه. این یعنی اگه ترافیک بشه یا منابع کم‌وزیاد بشه، تیم شبکه نمی‌تونن سریع واکنش نشون بدن و این باعث هدر رفتن انرژی و کارایی پایین میشه.

حالا تیم مقاله اومدن این مشکل رو حل کنن و گفتن: چرا همیشه باید تعیین کنیم کدوم کار (مثلاً کنترل کاربر) کجا و روی کدوم سروره؟ بذار هر موقع نیاز بود سریع تصمیم بگیریم! به این میگن “انتخاب پویا” توی O-CU Selection. (O-CU همون Central Unit توی O-RAN که یه جور مرکز کنترل داده‌ها تو شبکه است)

ولی خب… چطوری این تصمیم‌گیری‌ها انجام بشه که هم مصرف انرژی کم بشه، هم کیفیت سرویس (Quality of Service یا همون QoS که یعنی کاربر راضی باشه و تاخیر یا قطعی پیش نیاد) حفظ بشه؟

اینجا یه ایده باحال میاد وسط: بیان مسئله رو شبیه یه بازی حل کنن! بهش میگن Markov Decision Process، یعنی تصمیم‌گیری مرحله‌ای که تو هر مرحله باید بهترین کارو بر اساس وضعیت فعلی انجام بدی. حالا چه ابزاری بهتر از یادگیری تقویتی (Deep Reinforcement Learning یا همون DRL که میره سعی و خطا می‌کنه تا بفهمه چی بهتر کار می‌کنه)؟ اما خب شبکه‌ها چون ساختارشون مثل یه گراف هست—یعنی هر نود یا دستگاه با تعداد زیادی دیگه ارتباط داره—بهتره از Graph Neural Network (GNN) استفاده بشه؛ یعنی شبکه عصبی‌ای که رابطه‌ها رو توی گراف یاد می‌گیره.

توی این مقاله برای حل مشکل، یه سیستم ساختن به اسم GRLDyP که ترکیبی از یادگیری تقویتی و GNN هست. کاری که این سیستم می‌کنه، اینه:

  • لحظه به لحظه ساختار و وضعیت مصرف منابع شبکه رو می‌خونه (مثلاً پردازنده و پهنای باند)
  • تصمیم می‌گیره هر جریان جدید داده باید از چه مسیری بره و بهترین محل استقرار O-CU واسه اون چی باشه
  • همزمان هدفش اینه مصرف انرژی شبکه رو کم کنه، بدون اینکه کیفیت سرویس بترکه یا تاخیر زیاد بشه

برای اینکه این ایده رو تست کنن، از دیتاست واقعی استفاده کردن: اطلاعات واقعی یک شهر کانادایی (مونترال) توی بازه ۲۴ ساعته! نتایج جالب بود: ثابت شد همین انتخاب پویا و الگوریتم‌های هوشمند باعث میشن مصرف انرژی به طرز زیادی پایین بیاد، اونم بدون اینکه کاربرا متوجه هیچ افت کیفیتی بشن.

در مجموع، این مقاله نشون داد که اگه شبکه O-RAN رو هوشمند کنیم و روی انتخاب و جابه‌جایی لحظه‌ای سرویس‌ها شرط ببندیم، هم میشه انرژی ذخیره کرد هم کارایی و کیفیت سرویس رو حفظ کرد. اصلاً یادگیری تقویتی و گرافی یعنی آینده هوشمند و دوست‌دار محیط زیست توی شبکه‌ها!

منبع: +