لوکالایز کردن منبع تابش با هوش مصنوعی و گراف: روشی خفن برای شرایط پیچیده اینترنت اشیا

خب بچه‌ها امروز می‌خوام براتون یه روش باحال رو توضیح بدم که می‌تونیم باهاش خیلی دقیق بفهمیم منبع اشعه یا همون «Radiation Source» کجاست، اونم تو فضاهایی مثل اینترنت اشیا (Internet of Things یا همون IoT که یعنی کلی دستگاه به هم وصلن و داده رد و بدل می‌کنن) یا مثلاً توی محیط‌های پیچیده نظامی که هرکی داره سیگنال‌هایی می‌فرسته و دریافت می‌کنه.

داستان چیه؟ خب معمولاً پیدا کردن این منابع تابش توی این شرایط سخت خیلی کار آسونی نیست. مخصوصاً وقتی که مثلاً دشمن داره “جنگ الکترونیکی” یا همون Electronic Countermeasures انجام می‌ده و سعی می‌کنه سیگنال‌ها رو قاطی کنه تا نفهمیم کی کجاست. یا زمانی که تراکم سیگنال‌ها (همون cross-density distributions یعنی جایی که پر از سیگناله و یکی رو راحت نمی‌تونی تشخیص بدی) و همینطور مدام داره داده جدید به شبکه اضافه میشه، کلی قاطی‌پاطی میشه!

روش‌هایی که قبلاً استفاده می‌کردیم یعنی مثلاً خوشه‌بندی (clustering) با تنظیمات ثابت یا فقط بر اساس اشکال هندسی ساده، معمولاً نمی‌تونن تفاوت دینامیک سیگنال‌ها رو تشخیص بدن و گیر می‌افتن؛ یعنی وقتی تراکم داده‌ها بالا یا پایین می‌ره، دیگه جوابگو نیستن و لوکالایز کردن دچار خطا میشه.

ولی محققای این مقاله اومدن و یه ایده جدید زدن وسط! می‌گن بیاید یه روش هوشمند و تطبیق‌پذیر (adaptive) استفاده کنیم که بر اساس گراف (یعنی از ریاضیات گراف – جایی که نقاط و ارتباط بینشون رو مدل می‌کنیم) پیش بره و با توجه به تراکم لحظه‌ای داده‌ها، لوکالایز کنیم.

حالا این روش خلاقانه چطوری کار می‌کنه؟

۱. خوشه‌بندی تطبیقی با حذف نویز: یعنی اول با یه الگوریتم به اسم DBSCAN کار می‌کنه (DBSCAN یعنی یه جور خوشه‌بندی که بر پایه تراکم داده‌هاست و خودش خودش رو با تغییرات هماهنگ می‌کنه و نویز رو هم می‌تونه شناسایی کنه). خلاصه با این الگوریتم، یه دور اولیه، داده‌هایی که احتمالاً فقط نویزن از همون اول فیلتر میشن و خلوت‌تر میشه همه چی.

۲. تفکیک دقیق‌تر با مدل ترکیب گاوسی: بعدش با یه مدل آماری پیشرفته‌تر به اسم GMM یا همون Gaussian Mixture Model (این یکی یعنی داده‌ها رو فرض کن چندتا توده ابری باشند که هرکدوم یه رفتار آماری متفاوت دارن) میان اون خوشه‌هایی که هنوز مبهمن رو دوباره بررسی می‌کنن و با دقت بیشتری دسته‌بندی می‌کنن تا هدف واقعی پیدا بشه.

۳. آنالیز کلیک و ساخت ماتریس مجاورت: حالا که داده‌ها رو خوب دسته‌بندی کرد، یه ماتریس می‌سازه به اسم “ماتریس مجاورت احتمالاتی” (یعنی نشون میده هر دو نقطه چقدر احتمال داره واقعاً به یه خوشه تعلق داشته باشن). بعد از این مرحله، الگوریتم‌های کلیک گراف (clique algorithms یعنی دنبال گروه‌هایی می‌گرده که همه با هم ارتباط دارن و به اصطلاح ریاضی گراف، کلیک هستن) رو اجرا می‌کنن. اینجوری می‌تونن هدف‌هایی که واقعاً با هم سازگارن و همون منبع تابشن رو پیدا کنن.

نتیجه چی شد؟ خب، آزمایش کردن و دیدن تو شرایطی که داده‌ها مدام دارن آپدیت میشن و وضعیت خیلی پویا و شلوغه، با این روش جدید حداقل ۷۰ درصد دقت بهتری دارن نسبت به روش‌های سنتی! یعنی حسابی کاربردیه و برای پیاده‌سازی تو دنیای واقعی هم مقیاس‌پذیره (scalable یعنی به درد شبکه‌های خیلی بزرگ هم می‌خوره).

خلاصه‌ش اینکه این روش نه تنها نویزها رو بهتر تشخیص میده، بلکه وقتی تو اینترنت اشیا یا محیط جنگ الکترونیکی داری با جهانی از داده سروکله میزنی، خیلی سریع و هوشمند منبع تابش رو لوکالایز می‌کنه. نکته باحال ماجرا اینه که چون بر اساس گراف و مدل‌سازی احتمالاتیه، براحتی با داده‌های جدید به‌روزرسانی میشه و لازم نیست هر بار از اول کار رو شروع کنه!

پس دفعه بعد که خواستین منبع یه سیگنال گم‌شده رو پیدا کنید و محیط خیلی شلوغ و پیچیده بود، یاد این روش گراف-محور و هوشمند بیفتین!

منبع: +