ماجرای باحال تشخیص صدای حیوانات با کمک هوش مصنوعی: از تست تا فهم دقیق‌تر!

Fall Back

خب بذارین اول یه مقدمه کوچیک بگم: الان دیگه کلی دستگاه ضبط صدای حرفه‌ای داریم که می‌تونن مدت زیادی صدا ضبط کنن، حتی توی شرایط عجیب و غریبِ میدونی! این باعث شده دانشمندها به‌راحتی جمعیت حیوونا رو زیر نظر بگیرن، مخصوصاً با یه چیزی به اسم «اکواکوستیک» یا همون مطالعه صداهای طبیعت. یعنی خودشون نشستن کنار حیوونا نیستن، دستگاه‌هاشون رکورد می‌گیره و بعدش میشه بررسی کرد چند تا حیوون اون دور‌وبر هست.

حالا مشکل چیه؟ واقعیت اینه که خیلی وقتا برای فهمیدن اینکه روش تشخیص صدای اتوماتیک (یعنی هوش مصنوعی‌ها و شبکه عصبی‌ها) چقدر خوب کار می‌کنه، فقط یه سری اعداد و آمار از یادگیری ماشین رو نگاه می‌کنن و حس میکنن همه چی رو فهمیدن! در حالی‌که تحلیل دقیق صدایی (یعنی اینکه واقعاً صدا محسوسه یا نه، چقدر نویز اطراف تاثیر گذاشته و…) خیلی کم انجام میشه.

مثلاً فرض کن صدای یه حیون خاص مثل «راگ پترمیگان» (Rock Ptarmigan، یه جور پرنده که تو کوه و طبیعت شمال زندگی میکنه) رو می‌خوایم بررسی کنیم که چطور سیستم هوش مصنوعی می‌تونه جیغ و داد یا صداهاش رو تشخیص بده. تو این پروژه اومدن یه روش خیلی ساده برای تحلیل صدایی کارکرد سیستم تشخیص پیاده کردن.

بیاین یه کم فنی بشیم ولی باحال توضیح بدم: تو این روش، یه صدای مصنوعی (یعنی صداهایی که خودمون با نرم‌افزار درست کردیم و واقعی نیستن) رو با نسبت سیگنال به نویزهای مختلف (Signal-to-Noise Ratio یا همون SNR؛ یعنی نسبت بلندی صدای اصلی نسبت به شلوغی و نویزهای محیط اطراف) به سیستم می‌دن. بعد نگاه می‌کنن هوش مصنوعی چقدر ممکنه این صدا رو شناسایی کنه.

این روش نه تنها بهمون میگه سیستم چقدر توی پیدا کردن صدا توی نویزها قویه، بلکه کمک می‌کنه بفهمیم چطوری شبکه (همون مدل هوش مصنوعی) رو باید تمرین بدیم تا عملکردش بهتر شه. یه نکته جذابش اینه که می‌شه با همین روش، دقت کنیم که مثلاً با این سیستم تا چه فاصله‌ای از حیون می‌تونیم صداش رو شناسایی کنیم؛ یعنی مثلاً اگه یه راگ پترمیگان صدا کنه و فاصله‌ش زیاد باشه، ببینیم سیستم کار می‌کنه یا نه.

در نهایت، این کار باعث میشه بتونیم یه مدل‌سازی هم انجام بدیم که توش نشون بده با توجه به شرایط صدا (مثلاً جمعیت پرنده‌ها تو فلان محیط، یا نویزهای اطراف چطوری باشه و…) چطور سیستم تشخیص عمل می‌کنه. این یعنی میشه تقریباً تخمین زد چند تا پرنده اون منطقه دارن صدا در میارن، بدون اینکه یک‌سره و سخت تو طبیعت مراقبشون باشیم.

پس خلاصه‌ش اینکه این روش ساده و هوشمندانه می‌تونه شکاف بین آمار خشک یادگیری ماشین و نیازه واقعی محقق‌های طبیعت رو پر کنه. هم می‌فهمیم هوش مصنوعی کجاها قوی‌تره، هم می‌تونیم تحلیل دقیق‌تر داشته باشیم روی اینکه واقعاً چقدر صدای حیوونا رو شنیده و درست گزارش داده. از این به بعد، حتی اگه یه پرنده گوشه یه دشت دور داره می‌خونه، ما دستمون بهش می‌رسه! 😁
منبع: +