داستان از اینجا شروع میشه که شهرها دارن خیلی سریع و بیبرنامه گسترش پیدا میکنن. مثلاً منطقه پونه (Pune) تو هند به خاطر همین ساختوسازهای سریع و بدون برنامه چندبار سیل و رانش زمینهای عجیب تجربه کرده. خب طبیعتاً این همه تغییر باعث میشه محیط زیست حسابی به هم بریزه. پس لازمه که بفهمیم زمینها چطور دارن استفاده میشن و تاثیر آدمها روی طبیعت چیه. اینجاست که “کلاسبندی کاربری و پوشش زمین” یا همون LULC بهکار میاد.
حالا LULC (Land Use Land Cover) به زبان ساده یعنی اینکه بفهمیم کدوم قسمت زمین واسه چه کاریه: کجا ساختمون هست، کجا جنگله، کجا مزرعهست و… این اطلاعات به مدیرها و شهرداریا کمک میکنه تا بهتر برنامهریزی کنن و منابعشون رو درست تقسیم کنن.
برای اینکه این کار رو دقیق انجام بدن از عکسهای ماهوارهای استفاده میکنن. این عکسها اطلاعات رفلکتانس سطحی (یعنی اینکه نور چطور از سطح زمین برمیگرده) رو میدن و به ما کمک میکنن که نقشههای دقیقی تولید کنیم و بفهمیم هر جایی دقیقاً چیه.
اینجا پای شبکههای عصبی کانولوشنی (CNN یا Convolutional Neural Network) وسط میاد. اینا مدلهای هوش مصنوعی هستن که واسه پردازش تصویر خیلی کاربرد دارن. معمولاً اونا رو با activation functionی به اسم Relu (همون توابع فعالساز که تصمیم میگیرن یه نورون تو شبکه کار کنه یا نه) آموزش میدن. ولی یه مشکل هست: هر نورون تو این مدلها فقط میتونه یک مرز خطی برای تصمیمگیری بکشه. یعنی عملاً واسه مدلها سخته که همه جور شکل و کاربری زمین رو تشخیص بدن.
اینجاست که محققای این تحقیق یه ایده باحال زدن! اونا اومدن سراغ activation functionهای نوسانی (Oscillatory Activation Function). این یعنی توابعی که رفتارشون مثل سینوس و کسینوس بالا پایین میشه. نکته مهم اینه که با این توابع یک نورون میتونه چند تا مرز برای تصمیمگیری داشته باشه (نه فقط یکی!) و این کمک میکنه مدل کلیتر و دقیقتر بشه.
ترکیب این activation functionهای دورهای با ساختار عمیق شبکههای CNN باعث شد یه مدل جدید بسازن به اسم “شبکه عصبی کانولوشنی نوسانی” یا CONN (Convoluted Oscillatory Neural Network). خلاصه اینکه این مدل ترکیبی غیرخطی و نوسانی داره که باعث میشه عکسهای ماهوارهای رو خیلی دقیقتر بررسی کنه.
توی این پژوهش، نتیجهشون رو روی عکسهای LANDSAT-8 (که یه سری تصاویر ماهوارهای دقیق از زمین میده) برای منطقه پونه امتحان کردن. از یه activation function خاص هم استفاده کردن که اسمش بود “Decaying Sine Unit”. عملکردشون؟ تو مرحله آموزش accuracy شد تقریباً ۱۰۰٪ (۹۹.۹۹۹٪)، و وقتی مدل رو امتحان کردن accuracy شد حدود ۹۶٪ (۹۵.۹۷۹٪). این یعنی از مدلهای کلاسیک CNN هم بهتر کار کرد و تو مواردی مثل precision (دقت)، recall (توانایی به خاطر آوردن همه نمونههای صحیح)، و User’s Accuracy (دقت از دید کاربر) هم عالی بود.
واسه اینکه دقیقتر بفهمن مدل واقعا خوب کار میکنه یا نه، یه آزمایش ablation انجام دادن؛ ablation study یعنی اینکه میان بخشهایی از داده یا ویژگیها رو حذف میکنن تا ببینن مدل هنوز چقدر خوب میتونه دستهبندی کنه.
در کل، این مدل CONN با activation function نوسانی حسابی ترکونده و نشون داده واسه دستهبندی نوع کاربری زمین از روی عکس ماهوارهای شدیداً به درد بخوره؛ مخصوصاً واسه شهرهایی که رشد ناگهانی و بیبرنامه دارن و خطرات زیستمحیطی زیاد تهدیدشون میکنه. پس اگه یه روزی خواستن بفهمن تو شهرتون دقیقا کجاش باید خونه بسازن یا کجا جنگل بمونه، این مدل میتونه حسابی کمک کنه!
منبع: +