یه مدل عجیب‌غریب و خفن برای تشخیص نوع کاربری زمین از عکس‌های ماهواره‌ای (بر پایه شبکه‌های عصبی نوسانی!)

داستان از اینجا شروع میشه که شهرها دارن خیلی سریع و بی‌برنامه گسترش پیدا می‌کنن. مثلاً منطقه پونه (Pune) تو هند به خاطر همین ساخت‌وسازهای سریع و بدون برنامه چندبار سیل و رانش زمین‌های عجیب تجربه کرده. خب طبیعتاً این همه تغییر باعث میشه محیط زیست حسابی به هم بریزه. پس لازمه که بفهمیم زمین‌ها چطور دارن استفاده میشن و تاثیر آدم‌ها روی طبیعت چیه. اینجاست که “کلاس‌بندی کاربری و پوشش زمین” یا همون LULC به‌کار میاد.

حالا LULC (Land Use Land Cover) به زبان ساده یعنی اینکه بفهمیم کدوم قسمت زمین واسه چه کاریه: کجا ساختمون هست، کجا جنگله، کجا مزرعه‌ست و… این اطلاعات به مدیرها و شهرداریا کمک می‌کنه تا بهتر برنامه‌ریزی کنن و منابع‌شون رو درست تقسیم کنن.

برای اینکه این کار رو دقیق انجام بدن از عکس‌های ماهواره‌ای استفاده می‌کنن. این عکس‌ها اطلاعات رفلکتانس سطحی (یعنی اینکه نور چطور از سطح زمین برمی‌گرده) رو میدن و به ما کمک می‌کنن که نقشه‌های دقیقی تولید کنیم و بفهمیم هر جایی دقیقاً چیه.

اینجا پای شبکه‌های عصبی کانولوشنی (CNN یا Convolutional Neural Network) وسط میاد. اینا مدل‌های هوش مصنوعی هستن که واسه پردازش تصویر خیلی کاربرد دارن. معمولاً اونا رو با activation functionی به اسم Relu (همون توابع فعال‌ساز که تصمیم می‌گیرن یه نورون تو شبکه کار کنه یا نه) آموزش میدن. ولی یه مشکل هست: هر نورون تو این مدل‌ها فقط می‌تونه یک مرز خطی برای تصمیم‌گیری بکشه. یعنی عملاً واسه مدل‌‌ها سخته که همه جور شکل و کاربری زمین رو تشخیص بدن.

اینجاست که محققای این تحقیق یه ایده باحال زدن! اونا اومدن سراغ activation function‌های نوسانی (Oscillatory Activation Function). این یعنی توابعی که رفتارشون مثل سینوس و کسینوس بالا پایین میشه. نکته مهم اینه که با این توابع یک نورون می‌تونه چند تا مرز برای تصمیم‌گیری داشته باشه (نه فقط یکی!) و این کمک می‌کنه مدل کلی‌تر و دقیق‌تر بشه.

ترکیب این activation function‌های دوره‌ای با ساختار عمیق شبکه‌های CNN باعث شد یه مدل جدید بسازن به اسم “شبکه عصبی کانولوشنی نوسانی” یا CONN (Convoluted Oscillatory Neural Network). خلاصه اینکه این مدل ترکیبی غیرخطی و نوسانی داره که باعث میشه عکس‌های ماهواره‌ای رو خیلی دقیق‌تر بررسی کنه.

توی این پژوهش، نتیجه‌شون رو روی عکس‌های LANDSAT-8 (که یه سری تصاویر ماهواره‌ای دقیق از زمین میده) برای منطقه پونه امتحان کردن. از یه activation function خاص هم استفاده کردن که اسمش بود “Decaying Sine Unit”. عملکردشون؟ تو مرحله آموزش accuracy شد تقریباً ۱۰۰٪ (۹۹.۹۹۹٪)، و وقتی مدل رو امتحان کردن accuracy شد حدود ۹۶٪ (۹۵.۹۷۹٪). این یعنی از مدل‌های کلاسیک CNN هم بهتر کار کرد و تو مواردی مثل precision (دقت)، recall (توانایی به خاطر آوردن همه نمونه‌های صحیح)، و User’s Accuracy (دقت از دید کاربر) هم عالی بود.

واسه اینکه دقیق‌تر بفهمن مدل واقعا خوب کار می‌کنه یا نه، یه آزمایش ablation انجام دادن؛ ablation study یعنی اینکه میان بخش‌هایی از داده یا ویژگی‌ها رو حذف می‌کنن تا ببینن مدل هنوز چقدر خوب می‌تونه دسته‌بندی کنه.

در کل، این مدل CONN با activation function نوسانی حسابی ترکونده و نشون داده واسه دسته‌بندی نوع کاربری زمین از روی عکس ماهواره‌ای شدیداً به درد بخوره؛ مخصوصاً واسه شهرهایی که رشد ناگهانی و بی‌برنامه دارن و خطرات زیست‌محیطی زیاد تهدیدشون می‌کنه. پس اگه یه روزی خواستن بفهمن تو شهرتون دقیقا کجاش باید خونه بسازن یا کجا جنگل بمونه، این مدل می‌تونه حسابی کمک کنه!

منبع: +