اگه اهل هوش مصنوعی، یادگیری ماشین یا آمار باشی، احتمالاً اسم متریکها (یعنی معیارهایی که باهاشون فرق یا فاصله بین دو تا چیز رو اندازه میگیرن) به گوشت خورده. یکی از این متریکهای خاص و خفن، متریک کرامر (Cramér Metric) هست. حالا اومدن یه نسخه بامزهاش درست کردن به اسم متریک کرامر بُرشخورده یا Sliced Cramér Metric. بیاید ببینیم این ماجرا چیه.
اصلاً متریک کرامر بُرشخورده چیه؟
این متریک یه جور راه خلاقانه برای مقایسه کردن دو تا تابع یا حتی تصویر مختلفه؛ مخصوصاً وقتی پای تغییرات هندسی (یعنی جابجایی، کشیدگی یا پیچاندن دادهها) وسط باشه. “سِلایس” یا برشخوردن یعنی ما اون دادههامون رو توی جهتهای مختلف میبُریم (مثل این که از زاویههای مختلف نگاه کنیم) و بعد توی هر زاویه متریک رو حساب میکنیم، آخرش هم میانگین میگیریم.
ویژگی خفن Sliced Cramér: مقاومت در برابر دگرگونیها!
حالا چیزی که توی این مقاله خیلی روش تاکید شده، اینه که Sliced Cramér Metric به شدت نسبت به جورواجور دگرگونیهای هندسی مقاومه. یعنی اگه یه تابع یا تصویر رو خم کنی یا بکشی و دوباره مقایسه کنی، این معیار خیلی راحت گول نمیخوره و با یه کم تغییر، فاصله زیادی نشون نمیده. کلی توی مقاله محاسبات ریاضی هم انجام دادن که ثابت بشه فاصله طبق این معیار، با مقدار جابجایی و یه جور میانگین از تابع اولیه نسبت داره. خلاصه، بیخود بزرگ یا کوچک نشون نمیده!
کاربرد توی تصاویر و توموگرافی
اصلاً ماجرا به همینجا ختم نمیشه، گفتن این روش برای مقایسه بین پرجکشنهای توموگرافی (Tomographic Projections) هم تعمیم پیدا میکنه. یعنی اگه بدونی توموگرافی چیه (همون تصویربرداری لایهلایه مثل سیتیاسکن)، این متریک میتونه اونجا هم مفید باشه.
چه بلایی سرش میاد اگه داده رو کانوالو کنیم؟
توی مقاله به تاثیر کانواولوشن (Convolution یعنی یه جور ترکیب کردن یا محو کردن داده، مثل افکت بلور توی عکس) روی این متریک هم اشاره کردن. بررسی کردن که چطور این ترکیب داده روی مقدارِ محاسبهشده با Sliced Cramér تأثیر میذاره.
قیاس با متریکهای دیگه مثل Wasserstein
خب متریکی که تا الان حسابی اسمش در رفته توی دنیا، Wasserstein distance یا فاصله واسرشتاین هست؛ یه معیار مقایسه معروف که زیاد توی یادگیری ماشین و مقایسه توزیعها میاد وسط. مقاله این رو هم بررسی کرده که رفتار Sliced Cramér توی تغییرات و نویز و …، چه شباهتهایی با Wasserstein داره و کجاها فرق میکنه.
داستان پیادهسازی و سرعت محاسبه
حساب کن یه متریک عالی بسازی، بعد خودش ده ساعت طول بکشه تا حساب شه! خب بیفایدهس. نویسندههای مقاله دیدن که اگه با تکنیکهای فوریه (Fourier-based Discretization، یعنی تبدیل تابع یا سیگنال به فرکانسهاش برای سرعت بیشتر در محاسبه) کار کنن، هم برای دادههای یکبعدی و هم دوبعدی، میتونن خیلی سریعتر فاصله رو حساب کنن. خلاصه یه راه عملی و سریع برایش ساختن که واقعاً توی دنیای واقعی قابل استفاده باشه.
مقاومت در برابر نویزهای جورواجور
یکی دیگه از نکات مهم این مقاله اینه که نشون دادن این متریک در برابر نویزهای مختلف که یه جورهایی دنبالشون رو گرفتن (اینجا بهش میگن heteroscedastic noise، یعنی نویزهایی که میزانشون متفاوت و ثابت نیست)، خوب و مقاوم عمل میکنه و محاسباتش به این راحتیها به هم نمیریزه.
در آخر هم با کلی آزمایش عددی و شبیهسازی نشون دادن این حرفهاشون فقط رو کاغذ نیست، تو دنیای واقعی هم جواب میده!
در کل، اگه دنبال یه متریک مقایسه مدرن، سریع و مقاوم برای کارهای تصویری یا دادههای پیچیده هستی، Sliced Cramér Metric یکی از بهترین گزینههاست که مقاله همون کامل تحلیلش کرده و با مثال نشون داده چقدر خفنه!
منبع: +