خب بذارین اول یه مقدمه کوچیک بگم: الان دیگه کلی دستگاه ضبط صدای حرفهای داریم که میتونن مدت زیادی صدا ضبط کنن، حتی توی شرایط عجیب و غریبِ میدونی! این باعث شده دانشمندها بهراحتی جمعیت حیوونا رو زیر نظر بگیرن، مخصوصاً با یه چیزی به اسم «اکواکوستیک» یا همون مطالعه صداهای طبیعت. یعنی خودشون نشستن کنار حیوونا نیستن، دستگاههاشون رکورد میگیره و بعدش میشه بررسی کرد چند تا حیوون اون دوروبر هست.
حالا مشکل چیه؟ واقعیت اینه که خیلی وقتا برای فهمیدن اینکه روش تشخیص صدای اتوماتیک (یعنی هوش مصنوعیها و شبکه عصبیها) چقدر خوب کار میکنه، فقط یه سری اعداد و آمار از یادگیری ماشین رو نگاه میکنن و حس میکنن همه چی رو فهمیدن! در حالیکه تحلیل دقیق صدایی (یعنی اینکه واقعاً صدا محسوسه یا نه، چقدر نویز اطراف تاثیر گذاشته و…) خیلی کم انجام میشه.
مثلاً فرض کن صدای یه حیون خاص مثل «راگ پترمیگان» (Rock Ptarmigan، یه جور پرنده که تو کوه و طبیعت شمال زندگی میکنه) رو میخوایم بررسی کنیم که چطور سیستم هوش مصنوعی میتونه جیغ و داد یا صداهاش رو تشخیص بده. تو این پروژه اومدن یه روش خیلی ساده برای تحلیل صدایی کارکرد سیستم تشخیص پیاده کردن.
بیاین یه کم فنی بشیم ولی باحال توضیح بدم: تو این روش، یه صدای مصنوعی (یعنی صداهایی که خودمون با نرمافزار درست کردیم و واقعی نیستن) رو با نسبت سیگنال به نویزهای مختلف (Signal-to-Noise Ratio یا همون SNR؛ یعنی نسبت بلندی صدای اصلی نسبت به شلوغی و نویزهای محیط اطراف) به سیستم میدن. بعد نگاه میکنن هوش مصنوعی چقدر ممکنه این صدا رو شناسایی کنه.
این روش نه تنها بهمون میگه سیستم چقدر توی پیدا کردن صدا توی نویزها قویه، بلکه کمک میکنه بفهمیم چطوری شبکه (همون مدل هوش مصنوعی) رو باید تمرین بدیم تا عملکردش بهتر شه. یه نکته جذابش اینه که میشه با همین روش، دقت کنیم که مثلاً با این سیستم تا چه فاصلهای از حیون میتونیم صداش رو شناسایی کنیم؛ یعنی مثلاً اگه یه راگ پترمیگان صدا کنه و فاصلهش زیاد باشه، ببینیم سیستم کار میکنه یا نه.
در نهایت، این کار باعث میشه بتونیم یه مدلسازی هم انجام بدیم که توش نشون بده با توجه به شرایط صدا (مثلاً جمعیت پرندهها تو فلان محیط، یا نویزهای اطراف چطوری باشه و…) چطور سیستم تشخیص عمل میکنه. این یعنی میشه تقریباً تخمین زد چند تا پرنده اون منطقه دارن صدا در میارن، بدون اینکه یکسره و سخت تو طبیعت مراقبشون باشیم.
پس خلاصهش اینکه این روش ساده و هوشمندانه میتونه شکاف بین آمار خشک یادگیری ماشین و نیازه واقعی محققهای طبیعت رو پر کنه. هم میفهمیم هوش مصنوعی کجاها قویتره، هم میتونیم تحلیل دقیقتر داشته باشیم روی اینکه واقعاً چقدر صدای حیوونا رو شنیده و درست گزارش داده. از این به بعد، حتی اگه یه پرنده گوشه یه دشت دور داره میخونه، ما دستمون بهش میرسه! 😁
منبع: +