ماجرای جذاب متریک کرامر بُرش‌خورده و مقاومتش در برابر تغییرات!

Fall Back

اگه اهل هوش مصنوعی، یادگیری ماشین یا آمار باشی، احتمالاً اسم متریک‌ها (یعنی معیارهایی که باهاشون فرق یا فاصله بین دو تا چیز رو اندازه می‌گیرن) به گوشت خورده. یکی از این متریک‌های خاص و خفن، متریک کرامر (Cramér Metric) هست. حالا اومدن یه نسخه بامزه‌اش درست کردن به اسم متریک کرامر بُرش‌خورده یا Sliced Cramér Metric. بیاید ببینیم این ماجرا چیه.

اصلاً متریک کرامر بُرش‌خورده چیه؟
این متریک یه جور راه خلاقانه برای مقایسه کردن دو تا تابع یا حتی تصویر مختلفه؛ مخصوصاً وقتی پای تغییرات هندسی (یعنی جابجایی، کشیدگی یا پیچاندن داده‌ها) وسط باشه. “سِلایس” یا برش‌خوردن یعنی ما اون داده‌هامون رو توی جهت‌های مختلف می‌بُریم (مثل این که از زاویه‌های مختلف نگاه کنیم) و بعد توی هر زاویه متریک رو حساب می‌کنیم، آخرش هم میانگین می‌گیریم.

ویژگی خفن Sliced Cramér: مقاومت در برابر دگرگونی‌ها!
حالا چیزی که توی این مقاله خیلی روش تاکید شده، اینه که Sliced Cramér Metric به شدت نسبت به جورواجور دگرگونی‌های هندسی مقاومه. یعنی اگه یه تابع یا تصویر رو خم کنی یا بکشی و دوباره مقایسه کنی، این معیار خیلی راحت گول نمی‌خوره و با یه کم تغییر، فاصله زیادی نشون نمیده. کلی توی مقاله محاسبات ریاضی هم انجام دادن که ثابت بشه فاصله طبق این معیار، با مقدار جابجایی و یه جور میانگین از تابع اولیه نسبت داره. خلاصه، بیخود بزرگ یا کوچک نشون نمیده!

کاربرد توی تصاویر و توموگرافی
اصلاً ماجرا به همین‌جا ختم نمیشه، گفتن این روش برای مقایسه بین پرجکشن‌های توموگرافی (Tomographic Projections) هم تعمیم پیدا می‌کنه. یعنی اگه بدونی توموگرافی چیه (همون تصویربرداری لایه‌لایه مثل سی‌تی‌اسکن)، این متریک می‌تونه اونجا هم مفید باشه.

چه بلایی سرش میاد اگه داده رو کانوالو کنیم؟
توی مقاله به تاثیر کانواولوشن (Convolution یعنی یه جور ترکیب کردن یا محو کردن داده، مثل افکت بلور توی عکس) روی این متریک هم اشاره کردن. بررسی کردن که چطور این ترکیب داده روی مقدارِ محاسبه‌شده با Sliced Cramér تأثیر میذاره.

قیاس با متریک‌های دیگه مثل Wasserstein
خب متریکی که تا الان حسابی اسمش در رفته توی دنیا، Wasserstein distance یا فاصله واسرشتاین هست؛ یه معیار مقایسه معروف که زیاد توی یادگیری ماشین و مقایسه توزیع‌ها میاد وسط. مقاله این رو هم بررسی کرده که رفتار Sliced Cramér توی تغییرات و نویز و …، چه شباهت‌هایی با Wasserstein داره و کجاها فرق می‌کنه.

داستان پیاده‌سازی و سرعت محاسبه
حساب کن یه متریک عالی بسازی، بعد خودش ده ساعت طول بکشه تا حساب شه! خب بی‌فایده‌س. نویسنده‌های مقاله دیدن که اگه با تکنیک‌های فوریه (Fourier-based Discretization، یعنی تبدیل تابع یا سیگنال به فرکانس‌هاش برای سرعت بیشتر در محاسبه) کار کنن، هم برای داده‌های یک‌بعدی و هم دوبعدی، می‌تونن خیلی سریع‌تر فاصله رو حساب کنن. خلاصه یه راه عملی و سریع برایش ساختن که واقعاً توی دنیای واقعی قابل استفاده باشه.

مقاومت در برابر نویزهای جورواجور
یکی دیگه از نکات مهم این مقاله اینه که نشون دادن این متریک در برابر نویزهای مختلف که یه جورهایی دنبال‌شون رو گرفتن (این‌جا بهش می‌گن heteroscedastic noise، یعنی نویزهایی که میزان‌شون متفاوت و ثابت نیست)، خوب و مقاوم عمل می‌کنه و محاسباتش به این راحتی‌ها به هم نمی‌ریزه.

در آخر هم با کلی آزمایش عددی و شبیه‌سازی نشون دادن این حرف‌هاشون فقط رو کاغذ نیست، تو دنیای واقعی هم جواب میده!

در کل، اگه دنبال یه متریک مقایسه مدرن، سریع و مقاوم برای کارهای تصویری یا داده‌های پیچیده هستی، Sliced Cramér Metric یکی از بهترین گزینه‌هاست که مقاله همون کامل تحلیلش کرده و با مثال نشون داده چقدر خفنه!

منبع: +