اگه هند رو بشناسی، میدونی که موتورسواری بدون کلاه توی خیابونهاش خیلی عادی شده! نه تنها جون خودشون رو به خطر میندازن، بلکه بقیه آدمهای توی جاده هم کلی دچار مشکل میشن. داستان فقط هم به بیکلاهی ختم نمیشه؛ سهنفره موتور سوار شدن، بار زیاد بردن رو موتور، همهش توی خیابونهای هند دیدی!
خب، معمولاً نیروی پلیس و کارهای سنتی نمیتونن همه رو زیر نظر بگیرن. حالا بیایم واقعبین باشیم، هند واقعاً شلوغه! واسه همین الان دارن میرن سراغ تکنولوژیهای هوشمند. یکی از ترندهای این چند سال اخیر “یادگیری عمیق” هست. “یادگیری عمیق” یا همون Deep Learning یعنی به کامپیوترها یاد میدن که خودشون الگو یاد بگیرن و مثلاً عکس یا نوشته رو درست تشخیص بدن.
حالا یه تیم هندی اومدن یه کار خفن کردن: ۱. با کمک مدلهای یادگیری عمیق (که از قبل آموزش دیده بودن)، موتورسواری رو که کلاه نداره تشخیص میدن. ۲. بعدش هم شماره پلاک اون موتور رو لحظهای میخونن! شاخ نیست؟
اولین مرحله اینجوریه که از مدل DetectNet ساخت شرکت NVIDIA استفاده کردن. یه توضیح کوچیک: DetectNet یه مدل شناسایی شیء هست که خیلی سریع و قوی و با دقت بالا میتونه چیزهای مختلف رو توی تصویر پیدا کنه. پایه این مدل روی ResNet18 هست که یه جور شبکه عصبی کانولوشنیه (CNN). شبکه کانولوشنی همون چیزیه که به درد شناسایی عکس و تصویر میخوره چون میتونه الگوهای تصویری رو درست درک کنه. اونا اومدن با ابزار TAO شرکت NVIDIA که همون Train, Adapt, Optimize یا سادهتر بگم: آموزش دادن، تنظیم کردن و بهینهسازیه، این مدل رو برای شناسایی موتور و رانندهاش تنظیم کردن.
بعدش نوبت مرحله دومه! این مرحله ماموریتش اینه که بفهمه راننده کلاه گذاشته یا نه و بعدش خیلی سریع شماره پلاک رو بخونه. واسه این کار رفتن سراغ YOLOv8. شاید اسم YOLO رو شنیده باشی. YOLO یعنی You Only Look Once – خلاصه یه مدل هوش مصنوعی که با یه بار نگاه کردن به عکس، همه چیزهایی که باید رو پیدا میکنه! YOLOv8 آخرین ورژنشه، و به درد کارهایی مثل تشخیص لحظهای اشیاء و پلاکخوانی حسابی میخوره. این مدل مستقیماً کادر دور چیزهایی که پیدا کرده میکشه و احتمال کلاسشون رو هم میده.
حالا یه مشکل: توی اینترنت دیتاهای مناسب و کافی برای آموزش مدل پیدا نکردن. کاری که کردن این بوده که خودشون دست به کار شدن و یه مجموعه داده (یا همون دیتاست) اختصاصی درست کردن که توش کلی عکس واقعی از موتور و راننده توی سناریوهای سخت وجود داره. اینطوری مطمئن شدن مدلشون واقعا توی شرایط واقعی خیابونهای هند هم جواب بده.
نتیجه جالب بود: مدلشون تونست سالما با دقت ۹۸.۵۶ درصد راننده بیکلاه رو شناسایی کنه! تازه، پلاک موتور رو هم با دقت ۹۷.۶ درصد زمانی که کسی کلاه نذاشته بود، درست خوند.
هدف کل این داستان هم روشنه: بتونن با استفاده از “هوش مصنوعی” و این تکنولوژی جدید، یه نظارت بلادرنگ (یعنی آنی و زنده) روی خیابونها داشته باشن که دیگه کسی نتونه بیکلاه موتورسواری کنه و براحتی هم جریمه بشه.
در کل میشه گفت، این نوع کارها باعث میشن قوانین راهنمایی و رانندگی توی کشورهای شلوغی مثل هند بهتر اجرا بشه و امنیت مردم خیلی بیشتر بشه. هوش مصنوعی و یادگیری عمیق واقعاً دارن میرن تو جزئیات زندگی روزمره ما، حتی واسه چیزهایی مثل شناختن بیکلاهها روی موتور!
منبع: +