خب بچهها بیاید یه موضوع خفن رو با هم باز کنیم که خیلی سر و صدای خودش رو تو دنیای هوش مصنوعی و مدلهای پیشبینی درآورده! بحث، سر پیشبینی سریهای زمانی طولانیه، یعنی مثلاً پیشبینی آب و هوا برای چند هفته آینده، یا بورس و حتی سنسورهای صنعتی که کلی داده مختلف توی زمان ثبت میکنن.
اول بذارید یه چیز رو روشن کنیم: سری زمانی همون دادههایی هستن که تو بازههای زمانی پشت سر هم ثبت میشن، مثلاً دمای هوا هر روز یا قیمت بیتکوین تو هر ساعت. حالا مشکل اینجاست که اگه بخوایم برای یه مدت طولانی آینده رو پیشبینی کنیم، سه تا چالش خیلی جدی داریم:
۱. سروصدای دادهها یا همون نویز: دادهها همیشه تمیز و مرتب نیستن، هی سروصدا و اشتباه دارن و باید اول از همشون خلاص شیم.
۲. وابستگیهای پیچیده بین دادهها: اینجا منظور اینه که مثلاً قیمت نفت روی دلار تاثیر میذاره و اونم روی سهام تأثیر داره. این وابستگیها مدام تغییر میکنن و باید بتونیم همشونو دنبال کنیم.
۳. ثبات و واقعگرایی پیشبینیها: خرج نکنیم یه پیشبینی عجیب و غریب تحویل بدیم که اصلاً تو دنیای واقعی معنی نداره!
حالا تو این مقاله اومدن یه روش باحال معرفی کردن به اسم PRISM. بیا ببینیم چی کار میکنه:
PRISM در اصل چیه؟
PRISM یه مدل پیشبینی سری زمانی هست که از چندتا تکنیک خاص استفاده میکنه:
- یه چیزی داره به اسم score-based diffusion preconditioner که معنی سادهش میشه یه سیستمی برای کم کردن نویز یا همون سروصداهای داده؛ یعنی قبل اینکه پیشبینیشو بکنه، اول دادهها رو تا جایی که میشه تمیز میکنه.
- بعد یه گراف داینامیک با threshold correlation درست میکنه. راحت بخوام بگم: یه گراف یعنی شبکهای از نقطهها که هر نقطه یه دادهست (مثلاً سنسور یا کشور یا شرکت یا هرچی)، و خطها هم نشوندهنده اینه که چقدر به هم ربط دارن. اینجا شبکه همش آپدیت میشه و فقط رابطههایی رو توش میذاره که واقعاً معنادار باشن.
- مرحله آخر هم یه بخشی به اسم forecast head with physics penalties داره؛ یعنی وقت پیشبینی کردن، بعضی قوانین پایه فیزیکی رو رعایت میکنه که خروجیهاش پرت و پلا نشه. مثل اینکه پیشبینی کنه دمای هوا منفی ۵۰۰ درجه میشه که خب فیزیکی نیست!
یه نکته جالب:
اونها اومدن نشون دادن که مدلشون جلوی تکرار اشتباه و آشوب رو تو پیشبینی طولانی میگیره (یعنی پیشبینیهاش منحرف نمیشن). حتی اومدن حدود ریاضیای به اسم Lipschitz bounds رو هم حساب کردن که یعنی مدلشون بیش از حد بالا و پایین نمیره و خروجیش کنترل شدهست! (Lipschitz bound یه قاعده ریاضی برای کنترل نوسانهاست، خلاصه).
آزمون و نتیجه:
در نهایت، PRISM رو روی شش تا دیتاست معروف امتحان کردن و تونستن تو همهشون بهترین نتیجه رو بگیرن — هم تو معیار MSE (میانگین مربع خطا) و هم MAE (میانگین قدرمطلق خطا). یعنی مدلشون هم خطاش کمتره و هم قابل اطمینانتره.
خلاصه، اگه با دادههای سری زمانی زیاد سروکار داری و دوست داری پیشبینیهات هم تمیز باشه، هم واقعگرایانه و هم پایدار، PRISM خیلی چیز باحالیه. یه جورایی نویز دادهها رو میگیره، شبکه ارتباطاتشون رو هوشمندانه دنبال میکنه و در نهایت یه پیشبینی منظم میده که تو عالم واقعی هم جواب میده!
منبع: +