یه نگاه باحال به هوش مصنوعی برای پیدا کردن صدای حیونا تو طبیعت!

Fall Back

بیا راجع به یه موضوع جالب حرف بزنیم! این روزا تکنولوژی یه جوری پیشرفت کرده که حتی می‌تونن با دستگاه‌های ضبط صدای خیلی طولانی (همون رکوردرهایی که می‌ذارن تو طبیعت، هفته‌ها خودشون ضبط می‌کنن!) صداهای حیونا رو تو دل جنگل یا کوه ضبط کنن. مثلاً برای مراقبت از جمعیت پرنده‌هایی مثل راک پترمیگن (Rock Ptarmigan، یه نوع پرنده کوهستانی معروف در مناطق سرد)، کلی اطلاعات باحال از صداهاشون به دست میاد.

حالا مسئله اینجاست که: چطوری بین این همه صدا، صدای این پرنده‌ها رو پیدا کنیم؟ اینجاست که هوش مصنوعی و مخصوصاً شبکه‌های عصبی وارد می‌شن. شبکه عصبی (Neural Network) یعنی سیستم کامپیوتری که سعی می‌کنه مثل مغز آدم یاد بگیره و اطلاعات رو تحلیل کنه. اخیراً اکثر مدل‌هایی که برای شناسایی خودکار صدا استفاده می‌شن، بر اساس همین شبکه‌های عصبی کار می‌کنن.

ولی یه مشکلی هست: معمولاً کارایی این مدل‌ها رو فقط با معیارهای معمول یادگیری ماشین (Machine Learning Metrics، یعنی عددهایی که نشون می‌دن مدل چقدر دقت داره یا چندتا از صداها رو درست تشخیص داده) می‌سنجن. خیلی کم پیش میاد به صورت آکوستیک (یعنی دقیقاً اینکه صدا تا چه حد خوب تشخیص داده شده و تو شرایط صوتی مختلف چه نتایجی گرفته) این مسئله رو بررسی کنن.

حالا تو این مقاله دوست‌داشتنی، بچه‌ها اومدن یه روش خیلی ساده و جدید برای تحلیل آکوستیکیِ عملکرد این سیستم پیشنهاد دادن. ایده‌شون چیه؟ اونا سعی کردن نسبت سیگنال به نویز (Signal to Noise Ratio یا به اختصار SNR که یعنی اندازه‌ی بلندی صدای اصل نسبت به نویز و صداهای مزاحم اطراف) صداهای مصنوعی رو با احتمال شناسایی شدن اونها توسط سیستم مقایسه کنن. خلاصه ش اینکه هر چی نویز بیشتر باشه، احتمال اینکه هوش مصنوعی بتونه صدا رو پیدا کنه کمتر می‌شه. با بررسی این نسبت، می‌فهمن مدل تو شرایط واقعی چقدر حرفه‌ای صدا رو تشخیص می‌ده.

نتیجه جالب اینه که این روش به توسعه‌دهنده‌ها نشون می‌ده مدلشون رو باید چجوری آموزش بدن یا چه تنظیماتی رو تغییر بدن که در وضعیت‌های مختلف بهتر جواب بده. حتی اینجوری می‌تونن پیش‌بینی کنن هوش مصنوعی مورد نظر، صدای پرنده رو از چه فاصله‌ای می‌تونه بگیره. مثلاً اگه یه پرنده از فاصله‌ی دورتری آواز بخونه، مدل شانس داره پیداش کنه یا نه؟

نکته خفن‌تر اینجاست که با این سنجش تازه، دانشمندها می‌تونن تخمین بزنن تو یه منطقه چقدر از این پرنده‌ها دارن صدا درمیارن و این یعنی می‌شه یه نقشه تقریبی از چگالی جمعیت حیوانی هم داشت!

در کل، هدف این پژوهش اینه که فقط به اعداد خشک یادگیری ماشین بسنده نکنن و یه نگاه عمیق‌تر و واقعی‌تر به عملکرد سیستم تو محیط طبیعی داشته باشن. خلاصه که آکوستیک رو وارد ماجرا کردن و نشون دادن این کار چقدر کمک می‌کنه به فهم بهتر و کاربردی‌تر سیستم‌های مانیتورینگ زیست‌محیطی.
منبع: +