کشف خودکار خرابی توی شبکه‌های ۵G با هوش مصنوعی زبون‌باز!

Fall Back

خب بچه‌ها، بیاید امروز با هم راجع به یه موضوع خفن توی دنیای شبکه و تکنولوژی حرف بزنیم! همون شبکه‌های ۵G که همه دارن از سرعت و امکانات عجیب غریبش تعریف می‌کنن. ولی خب، پشت این شبکه‌های پیشرفته، کلی دردسر هست، مخصوصاً وقتی یه اختلال یا خرابی (Fault) پیش میاد. چون این شبکه‌ها انقدر بزرگ شدن و داده‌هاشون زیاد شده که دیگه روش‌های قدیمی کشف مشکل، واقعاً جواب نمی‌دن و کلی زمان و هزینه می‌تونه تلف کنه.

حالا چی شد؟ ایده جالب اینه که بریم سراغ Large Language Models یا همون LLMها، که یعنی مدل‌هایی از هوش مصنوعی که خیلی خوب زبان طبیعی رو می‌فهمن و می‌تونن متونی شبیه آدم بنویسن یا تحلیل کنن. اگه نمی‌دونی، LLMها همون مدل‌هایی هستن که پشت ChatGPT یا Bard و امثال اینا کار می‌کنن.

توی این مطالعه، اومدن از همین مدل‌ها برای کشف و دسته‌بندی اتوماتیک خرابی‌ها تو شبکه‌های ۵G استفاده کردن! یعنی مثلاً وقتی قسمتی از شبکه مثلاً مشکل پیدا می‌کنه یا کند میشه یا یه خطایی رخ میده، این مدل رو می‌ندازن وسط که خودش بفهمه چی پیش اومده و حتی نوع مشکل رو هم تشخیص بده.

چه جوری این کارو کردن؟ اومدن یه شبکه آزمایشی درست کردن که مبنای کارش Kubernetes بوده. Kubernetes هم یه پلتفرمیه واسه مدیریت میکروسرویس‌ها و برنامه‌هایی که بر پایه کانتینر کار می‌کنن. تو این شبکه آزمایشی، خودشون انواع خرابی‌های مختلف رو عمداً وارد کردن! مثلاً:

  • خرابی یا از کار افتادن یک پاد (pod failure). پاد همون بخشی از یه برنامه یا سرویسه که تو Kubernetes می‌چرخه.
  • کشتن یه پاد (pod kill)، یعنی یه بخشی رو دستی یا اتفاقی متوقف می‌کنن.
  • تاخیر توی شبکه (network delay)، یعنی ارتباط‌ها کند میشن.
  • از دست دادن شبکه (network loss)، که یعنی بسته‌های اطلاعاتی گم میشن.
  • خرابی دیسک یا مشکلات ورودی/خروجی دیسک (disk I/O failure)، یعنی اختلال تو کار هارد یا حافظه سرور.

داده‌هایی که جمع کردن شامل لاگ‌های این بخش‌ها، توضیحات سیستمی، رویدادها (events)، تست زمان رفت و برگشت یا RTT (یعنی مدت زمانی که طول می‌کشه یک بسته داده بره و جواب بیاد)، و خلاصه اطلاعات کلی بخش‌ها بوده.

این داده‌ها رو دادن به یه نسخه به صورت “نانو” از مدل GPT-4.1 (همون هوش مصنوعی معروف OpenAI) و مدل رو روی این دیتاها به صورت خاص آموزش دادن – به این کار می‌گن fine-tuning یعنی مدل رو با اطلاعات مخصوص خودمون باهوش‌تر کنیم.

نتیجه؟ دقت تشخیص خطا و پیدا کردن نوع مشکل خیلی بالاتر رفت نسبت به حالتی که مدل خام و بدون تخصص استفاده بشه. یعنی عملاً این مدل‌های زبان قوی می‌تونن بدون کمک اپراتور (اونایی که پشت سیستم نشستن و شبکه رو کنترل می‌کنن)، به صورت خودکار عیب‌یابی کنن و مشکل رو کشف و حتی طبقه‌بندی کنن.

اگه این روش گسترده‌تر بشه، می‌تونه واقعا خرج‌های مربوط به خرابی شبکه و کندی سرویس رو برای شرکت‌های سرویس دهنده کلی کم کنه و شبکه‌ها هم قابل اعتمادتر بشن. خلاصه که تکنولوژی AI داره روز به روز باحال‌تر میشه و حتی دنیای شبکه‌های پیچیده رو هم راحت‌تر و کم‌دردسرتر می‌کنه!

منبع: +