آدا میکس‌تی: ترکیب منعطف و هوشمند چندتا کارشناس برای پیش‌بینی بهتر سری‌های زمانی!

Fall Back

اگه تا حالا با پیش‌بینی سری‌های زمانی سروکار داشتی، مثلا پیش‌بینی آب‌وهوا یا ترافیک و قیمت برق، حتما می‌دونی که کار راحتی نیست! سری زمانی یعنی یه مدل داده که به مرور زمان جمع میشه؛ مثلاً دمای هوا هر ساعت یا ترافیک هر روز و اینا. پیش‌بینی‌ش کلی چالش داره، چون باید الگوهای مختلفی رو توی داده‌ها پیدا کنی، اونم نه فقط یه الگو، که چندین الگوی هم‌زمان و در مقیاس‌های مختلف.

تا الان مدل‌های زیادی برای این کار اومدن که بیشترشون یا فقط یه جور خاص به داده نگاه می‌کنن (مثلاً فقط تکه‌های کوچیک یا بزرگ از داده رو بررسی می‌کنن)، یا اینکه بلد نیستن چندتا ویژگی مختلف رو با هم ترکیب کنن. همین باعث میشه نتونن همه پیچیدگی‌های این مدل داده‌ها رو خوب بفهمن و پیش‌بینی‌هاشون معمولاً محدود و بعضی وقتا خوب در نمیاد.

حالا بریم سراغ یه روش جدید و باحال که اسمش هست AdaMixT، که مخفف “Adaptive Weighted Mixture of Multi-Scale Expert Transformers”ـه! حالا یعنی چی؟

اولاً، Transformers یه نوع مدل هوش مصنوعی هست که اصلاً باهاش کارهای جذابی مثل ترجمه متن، پردازش زبان، و اخیراً سری زمانی رو انجام میدن. حالا این AdaMixT اومده و یه مدل ساخته که چندتا متخصص مختلف (بهشون Expert یا کارشناس میگن) رو با هم ترکیب می‌کنه، اونم توی مقیاس‌های مختلف دیتا.

ایده‌ش اینه که بجای اینکه فقط یه نگاه ثابت به داده بندازی، از چند زاویه و چند فاصله داده رو بررسی کنی. مثلاً بعضیاش فقط بخش‌های کلی و بلندمدت رو می‌بینن، بعضی دیگه سریع روی جزئیات کوتاه‌مدت زوم می‌کنن. این طوری مدل می‌تونه هم روندهای کلی رو بفهمه و هم ریزه‌کاری‌ها رو از دست نده.

AdaMixT چندتا نکته جذاب داره:

  • اول اینکه از “Patch”‌های مختلف استفاده می‌کنه. Patch یعنی بخش‌های بریده‌شده از داده‌های سری زمانی. هر Patch می‌تونه کوتاه یا بلند، بسته به مدل باشه.
  • دوم اینکه، دو مدل پایه توی ساختارش داره: یکی General Pre-trained Models (GPM) یعنی مدل‌هایی که قبلاً روی کلی داده آموزش دیدن و برای کارای عمومی خوبن. یکی هم Domain-specific Models (DSM) یعنی مدل‌هایی که مخصوص یه حوزه خاص، مثلاً فقط آب‌وهوا، آموزش دیدن.

اما چیزی که این رو واقعاً باحال می‌کنه، یه شبکه به اسم “گیتینگ” یا دروازه‌بانی هست (Gating Network). ببین مثلاً وقتی داری بین چندتا کارشناس انتخاب می‌کنی که بیشتر به حرف کی گوش بدی، این شبکه هجورایی مثل داور وسطه که تصمیم می‌گیره کدوم کارشناس توی کجا و در چه زمانی، وزن بیشتری داشته باشه.

این انعطاف باعث میشه AdaMixT خیلی بهتر بتونه تفاوت‌های داده رو درک کنه و با شرایط مختلف هماهنگ شه. خودشون توی مقاله اومدن این مدل رو روی هشت تا دیتاست معروف تست کردن. مثالاش:

  • Weather (آب‌وهوا)
  • Traffic (ترافیک جاده‌ها)
  • Electricity (مصرف برق)
  • ILI (داده‌های مربوط به آنفُلوآنزا)
  • و چهار تا مجموعه داده با نام ETT
    نتیجه هم نشون داده تو همه شرایط، عملکردش نسبت به مدل‌های قبلی بهتر بوده.

در کل بخوام جمع‌بندی کنم: AdaMixT یه مدل هوش مصنوعیه که با ترکیب هوشمند و منعطف چندتا کارشناس در اندازه‌ها و حوزه‌های مختلف، پیش‌بینی سری زمانی رو دقیق‌تر و قابل اعتمادتر می‌کنه. مخصوصاً توی مسائلی که داده‌ها پیچیده‌ان و روندهای مختلف و عجیب دارن، این مدل می‌تونه خیلی به درد بخوره و محدودیت‌های روش‌های قدیمی رو کنار بزنه.

خلاصه اینکه، اگه دنبال پیش‌بینی بهتر توی کارهایی مثل کنترل ترافیک یا مدیریت انرژی هستی، AdaMixT می‌تونه خیلی بهت کمک کنه و هوشمندانه‌تر از مدل‌های قدیمی به داده‌ها نگاه می‌کنه!

منبع: +