ماجرای فیت کردن مدل دینامیکی با روش PIR: پارامترها رو با کمک علم و داده راحت پیدا کن!

بذار اول یه خبر خوب بهت بدم؛ یه روش جدید و باحال برای پیدا کردن پارامترهای مدل‌های دینامیکی غیرخطی پیدا شده که هم سریع‌تره، هم دقیق‌تر! اسم این روش رو گذاشتن Physics-Informed Regression یا به اختصار PIR. بخوام خیلی راحت توضیح بدم، این روش یعنی: «چطوری میشه با ترکیب علم فیزیک و داده‌های واقعی، پارامترهای یه مدل رو دقیق حساب کرد؟»

حالا بریم سر اصل ماجرا. تو خیلی از مدل‌های غیرخطی (مثلاً مدل‌هایی که رفتار پیچیده‌ی یه بیماری یا سیستم رو پیش‌بینی می‌کنن)، پیدا کردن پارامترهای درست یه چالش حسابی حساب میشه. اما اگه این مدل‌ها رو جوری بنویسیم که توی معادلاتشون نسبت به پارامترها “خطی” باشن، یعنی اگر پارامترها توی معادلات اومدن، فقط ضرایب باشن و نه مثلاً توی توان یا تقسیم و این چیزا، اون وقت با یه روش ساده به اسم Ordinary Least Squares یا همون “کمترین مربعات معمولی” (که یه جور تکنیک ریاضی برای پیدا کردن بهترین ضرایب بر اساس داده‌های واقعی هست) می‌تونیم کلی کار رو راحت‌تر کنیم. البته یه کم هم باید این روش رو منظم کنیم (که میگن Regularized) تا جواب‌های پراکنده نده.

PIR یه رویکرد ترکیبیه: هم از تئوری مدل استفاده می‌کنه، هم از داده‌هایی که داری. یعنی اگه یه سیستم دینامیکی داری (مثلاً اینکه اپیدمی کرونا توی یه کشور چطوری رفتار می‌کنه)، PIR میاد با کمک داده‌های واقعی مثلا آمار روزانه بیماران، پارامترهای مدل رو تخمین میزنه. نکته باحال این روش اینه که می‌تونیم هم روی ODEها (معادلات دیفرانسیل معمولی؛ یعنی مدل‌هایی که به مقدار قبلی‌شون بستگی دارن) و هم روی PDEها (معادلات دیفرانسیل جزئی؛ یعنی مدل‌هایی که به زمان و مکان با هم وابسته‌ان) استفاده کنیم.

برای اینکه نشون بدن این روش چقدر خوبه، چند تا مدل مختلف (از ساده تا پیچیده) رو تست کردن. مخصوصاً روی دو مدل مربوط به بیماری‌های واگیر (اپیدمیولوژیک) که یکی‌شون ساده‌تر بود و اون یکی پیچیده‌تر و پارامترهای بیشتری داشت. PIR رو با یه روش معروف دیگه به اسم PINN یا Physics-Informed Neural Networks مقایسه کردن. حالا اگه با PINN آشنا نیستی؛ یعنی استفاده از شبکه‌های عصبی که توش قانون فیزیک هم لحاظ شده تا مدل دقیق‌تر باشه. جفت این روش‌ها امتحانشون رو روی داده‌های مصنوعی (تولیدشده با پارامترهای از پیش معلوم) و همین‌طور داده‌های واقعی دنمارک موقع کرونا پس دادن.

نتیجه چی شد؟ هر دو روش تونستن پارامترهای هدف رو پیدا کنن، اما PIR مخصوصاً موقعی که مدل پیچیده‌تر شد، بهتر بود. تازه سرعت PIR هم بالاتر بوده! اگر برات مهمه که مثلا توی زمان واقعی (Real-time)، خیلی سریع جواب بگیری، PIR واقعاً انتخاب محبوب‌تریه.

یه نکته باحال دیگه: با PIR حتی میشه پارامترهایی که توی زمان تغییر می‌کنن رو هم حساب کرد (مثلاً اینکه نرخ گسترش کرونا توی ماه‌های مختلف تغییر داشته). اینو هم با داده‌های واقعی کرونا از دانمارک (بین سال ۲۰۲۰ تا ۲۰۲۱) نشون دادن.

در کل، این تحقیق نشون میده که ترکیب اطلاعات تئوری (یعنی قوانین فیزیکی مدل) و داده‌های واقعی می‌تونه به روش‌هایی مثل PIR کمک کنه تا تخمین پارامترها هم دقیق‌تر بشه، هم سریع‌تر. مخصوصاً برای مدل‌هایی که به شکل پارامتری خطی از آب دراومدن (حتی اگه مدل در کل غیرخطی باشه). خلاصه اگر دنبال یه روش باحال، سریع و دقیق برای تخمین پارامترهای مدل‌هات هستی، PIR رو حتما امتحان کن!

منبع: +