از سر و صدای داده‌ تا قانون و نظم: پیش‌بینی سری‌های زمانی با گراف‌های دینویزشده!

Fall Back

خب بچه‌ها بیاید یه موضوع خفن رو با هم باز کنیم که خیلی سر و صدای خودش رو تو دنیای هوش مصنوعی و مدل‌های پیش‌بینی درآورده! بحث، سر پیش‌بینی سری‌های زمانی طولانیه، یعنی مثلاً پیش‌بینی آب و هوا برای چند هفته آینده، یا بورس و حتی سنسورهای صنعتی که کلی داده مختلف توی زمان ثبت می‌کنن.

اول بذارید یه چیز رو روشن کنیم: سری زمانی همون داده‌هایی هستن که تو بازه‌های زمانی پشت سر هم ثبت می‌شن، مثلاً دمای هوا هر روز یا قیمت بیت‌کوین تو هر ساعت. حالا مشکل اینجاست که اگه بخوایم برای یه مدت طولانی آینده رو پیش‌بینی کنیم، سه تا چالش خیلی جدی داریم:

۱. سروصدای داده‌ها یا همون نویز: داده‌ها همیشه تمیز و مرتب نیستن، هی سروصدا و اشتباه دارن و باید اول از همشون خلاص شیم.
۲. وابستگی‌های پیچیده بین داده‌ها: اینجا منظور اینه که مثلاً قیمت نفت روی دلار تاثیر می‌ذاره و اونم روی سهام تأثیر داره. این وابستگی‌ها مدام تغییر می‌کنن و باید بتونیم همشونو دنبال کنیم.
۳. ثبات و واقع‌گرایی پیش‌بینی‌ها: خرج نکنیم یه پیش‌بینی عجیب و غریب تحویل بدیم که اصلاً تو دنیای واقعی معنی نداره!

حالا تو این مقاله اومدن یه روش باحال معرفی کردن به اسم PRISM. بیا ببینیم چی کار می‌کنه:

PRISM در اصل چیه؟
PRISM یه مدل پیش‌بینی سری زمانی هست که از چندتا تکنیک خاص استفاده می‌کنه:

  • یه چیزی داره به اسم score-based diffusion preconditioner که معنی ساده‌ش میشه یه سیستمی برای کم کردن نویز یا همون سروصداهای داده؛ یعنی قبل اینکه پیش‌بینیشو بکنه، اول داده‌ها رو تا جایی که میشه تمیز می‌کنه.
  • بعد یه گراف داینامیک با threshold correlation درست می‌کنه. راحت بخوام بگم: یه گراف یعنی شبکه‌ای از نقطه‌ها که هر نقطه یه داده‌ست (مثلاً سنسور یا کشور یا شرکت یا هرچی)، و خط‌ها هم نشون‌دهنده اینه که چقدر به هم ربط دارن. اینجا شبکه همش آپدیت میشه و فقط رابطه‌هایی رو توش می‌ذاره که واقعاً معنادار باشن.
  • مرحله آخر هم یه بخشی به اسم forecast head with physics penalties داره؛ یعنی وقت پیش‌بینی کردن، بعضی قوانین پایه فیزیکی رو رعایت می‌کنه که خروجی‌هاش پرت و پلا نشه. مثل اینکه پیش‌بینی کنه دمای هوا منفی ۵۰۰ درجه میشه که خب فیزیکی نیست!

یه نکته جالب:
اون‌ها اومدن نشون دادن که مدلشون جلوی تکرار اشتباه و آشوب رو تو پیش‌بینی طولانی می‌گیره (یعنی پیش‌بینی‌هاش منحرف نمیشن). حتی اومدن حدود ریاضی‌ای به اسم Lipschitz bounds رو هم حساب کردن که یعنی مدلشون بیش از حد بالا و پایین نمیره و خروجیش کنترل شده‌ست! (Lipschitz bound یه قاعده ریاضی برای کنترل نوسان‌هاست، خلاصه).

آزمون و نتیجه:
در نهایت، PRISM رو روی شش تا دیتاست معروف امتحان کردن و تونستن تو همه‌شون بهترین نتیجه رو بگیرن — هم تو معیار MSE (میانگین مربع خطا) و هم MAE (میانگین قدرمطلق خطا). یعنی مدلشون هم خطاش کمتره و هم قابل اطمینان‌تره.

خلاصه، اگه با داده‌های سری زمانی زیاد سروکار داری و دوست داری پیش‌بینی‌هات هم تمیز باشه، هم واقع‌گرایانه و هم پایدار، PRISM خیلی چیز باحالیه. یه جورایی نویز داده‌ها رو می‌گیره، شبکه ارتباطاتشون رو هوشمندانه دنبال می‌کنه و در نهایت یه پیش‌بینی منظم میده که تو عالم واقعی هم جواب می‌ده!

منبع: +