اگه تا حالا با پیشبینی سریهای زمانی سروکار داشتی، مثلا پیشبینی آبوهوا یا ترافیک و قیمت برق، حتما میدونی که کار راحتی نیست! سری زمانی یعنی یه مدل داده که به مرور زمان جمع میشه؛ مثلاً دمای هوا هر ساعت یا ترافیک هر روز و اینا. پیشبینیش کلی چالش داره، چون باید الگوهای مختلفی رو توی دادهها پیدا کنی، اونم نه فقط یه الگو، که چندین الگوی همزمان و در مقیاسهای مختلف.
تا الان مدلهای زیادی برای این کار اومدن که بیشترشون یا فقط یه جور خاص به داده نگاه میکنن (مثلاً فقط تکههای کوچیک یا بزرگ از داده رو بررسی میکنن)، یا اینکه بلد نیستن چندتا ویژگی مختلف رو با هم ترکیب کنن. همین باعث میشه نتونن همه پیچیدگیهای این مدل دادهها رو خوب بفهمن و پیشبینیهاشون معمولاً محدود و بعضی وقتا خوب در نمیاد.
حالا بریم سراغ یه روش جدید و باحال که اسمش هست AdaMixT، که مخفف “Adaptive Weighted Mixture of Multi-Scale Expert Transformers”ـه! حالا یعنی چی؟
اولاً، Transformers یه نوع مدل هوش مصنوعی هست که اصلاً باهاش کارهای جذابی مثل ترجمه متن، پردازش زبان، و اخیراً سری زمانی رو انجام میدن. حالا این AdaMixT اومده و یه مدل ساخته که چندتا متخصص مختلف (بهشون Expert یا کارشناس میگن) رو با هم ترکیب میکنه، اونم توی مقیاسهای مختلف دیتا.
ایدهش اینه که بجای اینکه فقط یه نگاه ثابت به داده بندازی، از چند زاویه و چند فاصله داده رو بررسی کنی. مثلاً بعضیاش فقط بخشهای کلی و بلندمدت رو میبینن، بعضی دیگه سریع روی جزئیات کوتاهمدت زوم میکنن. این طوری مدل میتونه هم روندهای کلی رو بفهمه و هم ریزهکاریها رو از دست نده.
AdaMixT چندتا نکته جذاب داره:
- اول اینکه از “Patch”های مختلف استفاده میکنه. Patch یعنی بخشهای بریدهشده از دادههای سری زمانی. هر Patch میتونه کوتاه یا بلند، بسته به مدل باشه.
- دوم اینکه، دو مدل پایه توی ساختارش داره: یکی General Pre-trained Models (GPM) یعنی مدلهایی که قبلاً روی کلی داده آموزش دیدن و برای کارای عمومی خوبن. یکی هم Domain-specific Models (DSM) یعنی مدلهایی که مخصوص یه حوزه خاص، مثلاً فقط آبوهوا، آموزش دیدن.
اما چیزی که این رو واقعاً باحال میکنه، یه شبکه به اسم “گیتینگ” یا دروازهبانی هست (Gating Network). ببین مثلاً وقتی داری بین چندتا کارشناس انتخاب میکنی که بیشتر به حرف کی گوش بدی، این شبکه هجورایی مثل داور وسطه که تصمیم میگیره کدوم کارشناس توی کجا و در چه زمانی، وزن بیشتری داشته باشه.
این انعطاف باعث میشه AdaMixT خیلی بهتر بتونه تفاوتهای داده رو درک کنه و با شرایط مختلف هماهنگ شه. خودشون توی مقاله اومدن این مدل رو روی هشت تا دیتاست معروف تست کردن. مثالاش:
- Weather (آبوهوا)
- Traffic (ترافیک جادهها)
- Electricity (مصرف برق)
- ILI (دادههای مربوط به آنفُلوآنزا)
- و چهار تا مجموعه داده با نام ETT
نتیجه هم نشون داده تو همه شرایط، عملکردش نسبت به مدلهای قبلی بهتر بوده.
در کل بخوام جمعبندی کنم: AdaMixT یه مدل هوش مصنوعیه که با ترکیب هوشمند و منعطف چندتا کارشناس در اندازهها و حوزههای مختلف، پیشبینی سری زمانی رو دقیقتر و قابل اعتمادتر میکنه. مخصوصاً توی مسائلی که دادهها پیچیدهان و روندهای مختلف و عجیب دارن، این مدل میتونه خیلی به درد بخوره و محدودیتهای روشهای قدیمی رو کنار بزنه.
خلاصه اینکه، اگه دنبال پیشبینی بهتر توی کارهایی مثل کنترل ترافیک یا مدیریت انرژی هستی، AdaMixT میتونه خیلی بهت کمک کنه و هوشمندانهتر از مدلهای قدیمی به دادهها نگاه میکنه!
منبع: +