خب بچهها، بیاید امروز با هم راجع به یه موضوع خفن توی دنیای شبکه و تکنولوژی حرف بزنیم! همون شبکههای ۵G که همه دارن از سرعت و امکانات عجیب غریبش تعریف میکنن. ولی خب، پشت این شبکههای پیشرفته، کلی دردسر هست، مخصوصاً وقتی یه اختلال یا خرابی (Fault) پیش میاد. چون این شبکهها انقدر بزرگ شدن و دادههاشون زیاد شده که دیگه روشهای قدیمی کشف مشکل، واقعاً جواب نمیدن و کلی زمان و هزینه میتونه تلف کنه.
حالا چی شد؟ ایده جالب اینه که بریم سراغ Large Language Models یا همون LLMها، که یعنی مدلهایی از هوش مصنوعی که خیلی خوب زبان طبیعی رو میفهمن و میتونن متونی شبیه آدم بنویسن یا تحلیل کنن. اگه نمیدونی، LLMها همون مدلهایی هستن که پشت ChatGPT یا Bard و امثال اینا کار میکنن.
توی این مطالعه، اومدن از همین مدلها برای کشف و دستهبندی اتوماتیک خرابیها تو شبکههای ۵G استفاده کردن! یعنی مثلاً وقتی قسمتی از شبکه مثلاً مشکل پیدا میکنه یا کند میشه یا یه خطایی رخ میده، این مدل رو میندازن وسط که خودش بفهمه چی پیش اومده و حتی نوع مشکل رو هم تشخیص بده.
چه جوری این کارو کردن؟ اومدن یه شبکه آزمایشی درست کردن که مبنای کارش Kubernetes بوده. Kubernetes هم یه پلتفرمیه واسه مدیریت میکروسرویسها و برنامههایی که بر پایه کانتینر کار میکنن. تو این شبکه آزمایشی، خودشون انواع خرابیهای مختلف رو عمداً وارد کردن! مثلاً:
- خرابی یا از کار افتادن یک پاد (pod failure). پاد همون بخشی از یه برنامه یا سرویسه که تو Kubernetes میچرخه.
- کشتن یه پاد (pod kill)، یعنی یه بخشی رو دستی یا اتفاقی متوقف میکنن.
- تاخیر توی شبکه (network delay)، یعنی ارتباطها کند میشن.
- از دست دادن شبکه (network loss)، که یعنی بستههای اطلاعاتی گم میشن.
- خرابی دیسک یا مشکلات ورودی/خروجی دیسک (disk I/O failure)، یعنی اختلال تو کار هارد یا حافظه سرور.
دادههایی که جمع کردن شامل لاگهای این بخشها، توضیحات سیستمی، رویدادها (events)، تست زمان رفت و برگشت یا RTT (یعنی مدت زمانی که طول میکشه یک بسته داده بره و جواب بیاد)، و خلاصه اطلاعات کلی بخشها بوده.
این دادهها رو دادن به یه نسخه به صورت “نانو” از مدل GPT-4.1 (همون هوش مصنوعی معروف OpenAI) و مدل رو روی این دیتاها به صورت خاص آموزش دادن – به این کار میگن fine-tuning یعنی مدل رو با اطلاعات مخصوص خودمون باهوشتر کنیم.
نتیجه؟ دقت تشخیص خطا و پیدا کردن نوع مشکل خیلی بالاتر رفت نسبت به حالتی که مدل خام و بدون تخصص استفاده بشه. یعنی عملاً این مدلهای زبان قوی میتونن بدون کمک اپراتور (اونایی که پشت سیستم نشستن و شبکه رو کنترل میکنن)، به صورت خودکار عیبیابی کنن و مشکل رو کشف و حتی طبقهبندی کنن.
اگه این روش گستردهتر بشه، میتونه واقعا خرجهای مربوط به خرابی شبکه و کندی سرویس رو برای شرکتهای سرویس دهنده کلی کم کنه و شبکهها هم قابل اعتمادتر بشن. خلاصه که تکنولوژی AI داره روز به روز باحالتر میشه و حتی دنیای شبکههای پیچیده رو هم راحتتر و کمدردسرتر میکنه!
منبع: +