چطور با کمک XGBoost مشکل خرابی داده‌های مغناطیسی ماهواره‌های GOES رو حل کردن!

ماهواره‌های سری GOES رو احتمالاً شنیدی، مخصوصاً اگه سمت هوافضا یا هواشناسی علاقه داشته باشی. این ماهواره‌ها یه سری دستگاه به اسم مگنتومتر (Magnetometer) دارن که کارش اندازه‌گیری دقیق میدان مغناطیسی اطراف زمینه – کلاً واسه پایش وضعیت فضا و حفاظت ماهواره‌ها خیلی مهمه. حالا مشکل اینجاست که هر از چندگاهی تو این ماهواره‌ها موتورهای خاصی به اسم arcjet thruster روشن می‌شن. Arcjet چیزی شبیه پیشران‌های الکتریکیه که واسه تنظیم موقعیت ماهواره به کار میره. ولی وقتی این موتور رو کار می‌افته، داده‌های مگنتومتر یک‌دفعه دچار نویز و خرابی می‌شن؛ یعنی دیگه نمی‌تونی بهشون اعتماد کنی!

تا الان واسه جبران این خرابی‌ها یه روشی با ماتریس تصحیح (Correction Matrix) داشتن که می‌اومد اثراتش رو کمتر کنه. اما این روش جلو تغییرات لحظه‌ای و بعضی خطاهای باقی‌مونده رو خوب نمی‌گیره. یعنی همیشه یه‌سری اشکال کوچیک توی داده‌ها باقی می‌مونه.

حالا تو این تحقیق جدید اومدن سراغ هوش مصنوعی و یه الگوریتم باحال به اسم XGBoost رو امتحان کردن. اگه نمی‌دونی XGBoost چیه، به طور ساده یه مدل یادگیری ماشین فوق‌العاده قوی و سریع برای پیش‌بینی و تصحیح داده‌هاست؛ مخصوصا وقتی داده‌ها پیچیده و غیرخطی باشن.

تو این پروژه، اومدن داده‌های مگنتومتر ماهواره GOES-17 رو که نویز گرفته بود با داده‌های سالم‌تر ماهواره GOES-18 مقایسه کردن و با استفاده از مدل XGBoost سعی کردن اثر خرابی arcjet رو حذف کنن. این کار به روش یادگیری نظارت‌شده (Supervised Learning) انجام شده؛ یعنی به مدل نشون دادن کِی داده‌ها سالمه و کِی خراب، تا خودش یاد بگیره راه درست رو تشخیص بده.

نتیجه خیلی جالب بوده: مدل XGBoost مخصوصاً روی دو تا مؤلفه E و P از داده‌های مغناطیسی بهتر عمل کرد و خیلی نویزهای مصنوعی و نامنظم رو کنترل کرد. در عوض، همون ماتریس تصحیح سنتی برای مؤلفه N هنوز بهتر جواب داد. پس به طور کامل نمی‌تونیم یکی رو جایگزین اون یکی کنیم – هرکدوم یه نقطه قوت دارن.

یه نکته مهم این بود که چون مدت زمانی که GOES-17 و GOES-18 کنار هم بودن (به این می‌گن collocation period) محدود بود، توی آموزش مدل یه مقدار محدودیت داشتن و هنوز جا برای بهتر شدنش هست. اما به طور کلی این روش نشون داد هوش مصنوعی واقعاً می‌تونه خطاهای پیچیده و غیرخطی ناشی از خود ماهواره رو بهتر بشناسه و تصحیح کنه. اگه تو ماموریت‌های بعدی بتونن مدت بیشتری دو ماهواره رو کنار هم نگه دارن، این مدل یادگیری ماشین XGBoost نشون داده که پتانسیل زیادی برای بهبود دقت داده‌ها داره.

در نهایت، این تجربه یه درس مهم داره: استفاده از یادگیری ماشین و مدل‌های قوی مثل XGBoost می‌تونه به طرز چشمگیری کیفیت داده‌های دانش‌فضا رو بالا ببره، کافیه حواسمون به تنظیمات و آموزش درست باشه. اگه باز مسئولین ماموریت‌های آینده ماهواره‌ای چنین شرایطی رو فراهم کنن، احتمالاً داده‌ها روزبه‌روز دقیق‌تر و قابل‌اعتمادتر می‌شن!

منبع: +