میدونی این روزا به خاطر افزایش خطر آتشسوزی، دیگه اهمیت یه سیستم تشخیص آتش سریع، فقط مال آتیشنشانی و جاهای خاص نیست! توی کارخونهها، ساختمونا، حتی توی جنگلها و مناطق روستایی هم هر لحظه ممکنه یه جرقه باشه و کل ماجرا رو به هم بریزه. هدف اصلی سیستمهای تشخیص آتش هم همینه: جایی که آتش میگیره، زود بفهمن تا ضرر مالی و صدمات جانی به حداقل برسه.
حالا خبر چیه؟ یه راهحل نوآورانه و خیلی باهوش اومده وسط: یه سیستم تشخیص آتش و دود تو لحظه که با کمک هوش مصنوعی و بینایی ماشین کار میکنه! اگه تا حالا اسم بینایی ماشین (Computer Vision) به گوشت نخورده، یعنی همون ماشینی که میتونه مثل چشم انسان تصاویر رو تحلیل کنه و چیزایی رو توش تشخیص بده. این سیستم با روشهای جدید یادگیری انتقالی (Transfer Learning) – یعنی استفاده از مدلهای یادگیری ماشین که قبلاً روی یه سری داده آموزش دیدن و حالا میشه دوباره واسه یه موضوع جدید بهینهشون کرد – توسعه داده شده.
توی رویکرد جدید، تیم پژوهشی اومده DetectNet_v2 رو انتخاب کرده (یه مدل معروف تو دنیای بینایی ماشین مثلاً)، بعد براش یه backbone از جنس ResNet-18 گذاشته (backbone همون ستون اصلی مدل یادگیری عمیق که ویژگیهای مهم تصویر رو استخراج میکنه). برای اینکه مدلشون واقعا قوی و همهفنحریف باشه، یه دیتاست سفارشی درست کردن با ۳۰۰۰ تا عکس واقعی و حتی عکسهایی که خودشون ساختن یا با ابزار بزرگشون دستکاری کردن تا مدلشون تو موقعیتهای صنعتی و شرایط مختلف قشنگ جواب بده.
حالا مدل اولیهشون رو با FP32 تمرین دادند – اگه نمیدونی FP32 یعنی مدلهایی که وزن و دادههاشون با عددهای نقطه-اعشاری ۳۲ بیتی ذخیره میشه، یعنی حسابی حرفهای و دقیق. واسه اینکه بشه این مدل قدرتمند رو تو دستگاههای کم توانتر (که بهشون Edge Devices میگن – اینا همون دستگاههایی هستن که معمولا تو خود محیط صنعتی هستن و نباید خیلی قوی و گرون باشن) اجرا کرد، اومدن مدل رو تیون و هرس کردن! هرس کردن مدل (Pruning) یعنی بخشهایی از مدل که خیلی مهم نیست رو حذف کردن تا هم سبکتر و هم سریعتر شه.
یه حرکت جذاب دیگه هم زدن: آموزش با آگاهی از کمیتسازی (Quantization-Aware Training یا QAT) که یعنی مدل یاد میگیره چطور با دادههای کمدقتتر (مثلا INT8 یعنی اعداد صحیح ۸ بیتی) هم خوب کار کنه. نتیجه؟ مدلشون با ۱۲.۷ درصد کاهش حجم، همون کارایی رو نگه داشته و حتی بهتر شده!
ولی بریم سراغ اصل مطلب: دقت مدل! این سیستم خفن تونسته دقت تشخیص آتش رو تا ۹۵.۶ درصد برسونه و برای دود هم ۹۲ درصد. مثلا فقط ۳.۵ درصد خطای false rate داره (False Rate یعنی مدل اشتباهی اعلام خطر کنه که اصلا آتش نیست!). سرعت تشخیصش هم عالیه – توی کارتهای گرافیک RTX فقط ۴۲ میلیثانیه طول میکشه تا نتیجه بده (یعنی تقریبا بدون معطلی). تازه تو یه رقابت جدی با مدلهای معروفی مثل YOLOv8، SSD MobileNet_v2 و Faster R-CNN هم مدل خودشون دقیقتر و قویتر ظاهر شده، چه از نظر precision (یعنی دقت تشخیص درست) و چه F1-score (یه شاخص ترکیبی برای دقت و صحت).
اگه دنبال اعداد خاص میگردی: mAP@0.5 شده ۹۴.۹ درصد و mAP@0.5:0.95 معادل ۸۷.۴ درصد. (mAP یعنی میانگین دقت مدل تو پیدا کردن محل دقیق آتش/دود تو تصاویر.)
برای اینکه نشون بدن واقعاً سیستمشون تو عمل هم جواب میده، اومدن سیستمشون رو روی دستگاههای Nvidia Jetson Orin Nano و Xavier NX هم اجرا کردن (اینا پردازندههای هوشمند و کممصرف واسه کارهای لبه شبکه و صنعتی هستن). نتیجه: مدلشون توی دنیای واقعی هم سریع و قابل اطمینانه، و حتی میشه «human-in-the-loop» کردش – یعنی وقتی مدل یه آتش یا دود رو تشخیص داد، قبل از اعلام هشدار نهایی، یه اپراتور انسانی هم یه نگاه بندازه و مطمئن شه که اشتباه نشده.
جمعبندی: اگه دنبال یه سیستم خفن تشخیص آتش داخل و بیرون محیط صنعتی هستی، با این مدل وایستادی رو لبه تکنولوژی! هم دقیق، هم سریع، هم مناسب دستگاههای کممصرف و هم قابل اطمینان برای شرایط بحرانی.
منبع: +