سیستم خفن تشخیص آتش و دود در لحظه برای محیط‌های صنعتی – با هوش مصنوعی و دید ماشینی!

می‌دونی این روزا به خاطر افزایش خطر آتش‌سوزی، دیگه اهمیت یه سیستم تشخیص آتش سریع، فقط مال آتیش‌نشانی و جاهای خاص نیست! توی کارخونه‌ها، ساختمونا، حتی توی جنگل‌ها و مناطق روستایی هم هر لحظه ممکنه یه جرقه باشه و کل ماجرا رو به هم بریزه. هدف اصلی سیستم‌های تشخیص آتش هم همینه: جایی که آتش می‌گیره، زود بفهمن تا ضرر مالی و صدمات جانی به حداقل برسه.

حالا خبر چیه؟ یه راه‌حل نوآورانه و خیلی باهوش اومده وسط: یه سیستم تشخیص آتش و دود تو لحظه که با کمک هوش مصنوعی و بینایی ماشین کار می‌کنه! اگه تا حالا اسم بینایی ماشین (Computer Vision) به گوشت نخورده، یعنی همون ماشینی که می‌تونه مثل چشم انسان تصاویر رو تحلیل کنه و چیزایی رو توش تشخیص بده. این سیستم با روش‌های جدید یادگیری انتقالی (Transfer Learning) – یعنی استفاده از مدل‌های یادگیری ماشین که قبلاً روی یه سری داده آموزش دیدن و حالا می‌شه دوباره واسه یه موضوع جدید بهینه‌شون کرد – توسعه داده شده.

توی رویکرد جدید، تیم پژوهشی اومده DetectNet_v2 رو انتخاب کرده (یه مدل معروف تو دنیای بینایی ماشین مثلاً)، بعد براش یه backbone از جنس ResNet-18 گذاشته (backbone همون ستون اصلی مدل یادگیری عمیق که ویژگی‌های مهم تصویر رو استخراج می‌کنه). برای اینکه مدلشون واقعا قوی و همه‌فن‌حریف باشه، یه دیتاست سفارشی درست کردن با ۳۰۰۰ تا عکس واقعی و حتی عکس‌هایی که خودشون ساختن یا با ابزار بزرگشون دست‌کاری کردن تا مدلشون تو موقعیت‌های صنعتی و شرایط مختلف قشنگ جواب بده.

حالا مدل اولیه‌شون رو با FP32 تمرین دادند – اگه نمی‌دونی FP32 یعنی مدل‌هایی که وزن و داده‌هاشون با عددهای نقطه‌-اعشاری ۳۲ بیتی ذخیره میشه، یعنی حسابی حرفه‌ای و دقیق. واسه اینکه بشه این مدل قدرتمند رو تو دستگاه‌های کم توان‌تر (که بهشون Edge Devices می‌گن – اینا همون دستگاه‌هایی هستن که معمولا تو خود محیط صنعتی هستن و نباید خیلی قوی و گرون باشن) اجرا کرد، اومدن مدل رو تیون و هرس کردن! هرس کردن مدل (Pruning) یعنی بخش‌هایی از مدل که خیلی مهم نیست رو حذف کردن تا هم سبک‌تر و هم سریع‌تر شه.

یه حرکت جذاب دیگه هم زدن: آموزش با آگاهی از کمیت‌سازی (Quantization-Aware Training یا QAT) که یعنی مدل یاد می‌گیره چطور با داده‌های کم‌دقت‌تر (مثلا INT8 یعنی اعداد صحیح ۸ بیتی) هم خوب کار کنه. نتیجه؟ مدلشون با ۱۲.۷ درصد کاهش حجم، همون کارایی رو نگه داشته و حتی بهتر شده!

ولی بریم سراغ اصل مطلب: دقت مدل! این سیستم خفن تونسته دقت تشخیص آتش رو تا ۹۵.۶ درصد برسونه و برای دود هم ۹۲ درصد. مثلا فقط ۳.۵ درصد خطای false rate داره (False Rate یعنی مدل اشتباهی اعلام خطر کنه که اصلا آتش نیست!). سرعت تشخیص‌ش هم عالیه – توی کارت‌های گرافیک RTX فقط ۴۲ میلی‌ثانیه طول می‌کشه تا نتیجه بده (یعنی تقریبا بدون معطلی). تازه تو یه رقابت جدی با مدل‌های معروفی مثل YOLOv8، SSD MobileNet_v2 و Faster R-CNN هم مدل خودشون دقیق‌تر و قوی‌تر ظاهر شده، چه از نظر precision (یعنی دقت تشخیص درست) و چه F1-score (یه شاخص ترکیبی برای دقت و صحت).

اگه دنبال اعداد خاص می‌گردی: mAP@0.5 شده ۹۴.۹ درصد و mAP@0.5:0.95 معادل ۸۷.۴ درصد. (mAP یعنی میانگین دقت مدل تو پیدا کردن محل دقیق آتش/دود تو تصاویر.)

برای اینکه نشون بدن واقعاً سیستمشون تو عمل هم جواب میده، اومدن سیستم‌شون رو روی دستگاه‌های Nvidia Jetson Orin Nano و Xavier NX هم اجرا کردن (اینا پردازنده‌های هوشمند و کم‌مصرف واسه کارهای لبه شبکه و صنعتی هستن). نتیجه: مدل‌شون توی دنیای واقعی هم سریع و قابل اطمینانه، و حتی میشه «human-in-the-loop» کردش – یعنی وقتی مدل یه آتش یا دود رو تشخیص داد، قبل از اعلام هشدار نهایی، یه اپراتور انسانی هم یه نگاه بندازه و مطمئن شه که اشتباه نشده.

جمع‌بندی: اگه دنبال یه سیستم خفن تشخیص آتش داخل و بیرون محیط صنعتی هستی، با این مدل وایستادی رو لبه تکنولوژی! هم دقیق، هم سریع، هم مناسب دستگاه‌های کم‌مصرف و هم قابل اطمینان برای شرایط بحرانی.

منبع: +