CASPER: روشی جدید واسه شکار پانزی‌های هوشمند تو بلاکچین، حتی با داده کم!

بذار اول یه چیزی رو روشن کنم: بازار ارز دیجیتال خیلی سریع داره رشد می‌کنه و هر روز کلی نوآوری و تکنولوژی جدید میاد وسط، مخصوصاً با چیزایی مثل بلاکچین. اما خب قاعدتاً هر چی تکنولوژی جلو بره، کلاهبردارها هم زرنگ‌تر می‌شن! یکی از شگردهای کلاهبرداری که این روزها بین رمزارزها مد شده، اسمش پانزی هوشمنده یا همون Smart Ponzi Scheme (یعنی طرح پانزی که با قرارداد هوشمند کار می‌کنه).

حالا طرح پانزی چیه؟ مثل این می‌مونه که یکی بهت قول سود بالا بده تا تو سرمایه‌گذاری کنی، ولی واقعیت اینه که پول نفرات جدید رو می‌گیرن و سود قبلیا رو باهاش می‌دن؛ یعنی هیچ سرمایه‌گذاری واقعی تو کار نیست. تو نسخه هوشمندش، این سیستم‌ها توی قراردادهای هوشمند (Smart Contract یعنی کدهای کامپیوتری‌ای که تو بلاکچین اجرا می‌شن)، پیاده می‌شن و باعث می‌شن کسی راحت نتونه این کلاهبرداری‌ها رو جدا کنه از کارای درست.

حالا چالش اصلی اینجاست: تشخیص این پانزی‌ها سخته و روش‌های سنتی (که بیشتر مبتنی بر یادگیری عمیق هستن، یعنی استفاده از مدل‌های هوش مصنوعی خیلی پیچیده) معمولاً نیاز دارن که کلی داده با برچسب آماده بشه (یعنی مشخص باشه کدوم تراکنش پانزیه و کدوم سالم). این تیپ داده‌ها اما خیلی کمیابه و همین باعث می‌شه آموزش دادن مدل‌ها یه کم گیر کنه.

این وسط، پژوهشگرها یه رویکرد باحال و خلاقانه پیشنهاد دادن به اسم «CASPER» (که مخفف Contrastive Approach for Smart Ponzi detectER with more negative samples هست). حالا Contrastive Learning چیه؟ یعنی مدل یه جوری آموزش می‌بینه که بتونه فرق بین چیزای مشابه و متفاوت رو خوب یاد بگیره، حتی اگه داده‌هاش بدون برچسب باشن. این طوری مدل می‌تونه بین کدهای قراردادهای هوشمند، اونایی که پانزی هستن رو از بقیه تشخیص بده، حتی وقتی داده برچسب‌خورده مخصوص این کار خیلی در دسترس نباشه. تازه، از داده‌های بدون برچسب هم به شدت استفاده می‌کنه و هزینه آموزش مدل رو هم به طور چشمگیری میاره پایین.

یه ویژگی باحال تو CASPER اینه که از «نمونه‌های منفی بیشتر» استفاده می‌کنه. یعنی چی؟ یعنی مدل کلی کد یا تراکنش که پانزی نیست رو به عنوان نمونه منفی می‌بینه تا قدرت تشخیصش بالاتر بره و تو پیدا کردن تقلبی‌ها قوی‌تر عمل کنه.

حالا بیاییم سراغ آزمایش‌هاش: این روش رو روی دیتاست XBlock تست کردن (XBlock یه مجموعه داده معروف تو حوزه بلاکچین و قراردادهای هوشمنده) و نتیجه‌ها واقعاً امیدوارکننده بودن!

وقتی همه داده‌ها برچسب داشتن (یعنی مدل با 100 درصد داده برچسب‌خورده آموزش دید)، CASPER تونست 2.3 درصد بهتر از مدل‌های قبلی عمل کنه (اینجا معیارشون F1 Score بوده، که یه جور معیار برای اندازه‌گیری دقت مدل‌هاست). ولی اصل غافلگیرکننده‌اش اینه که وقتی فقط 25 درصد داده با برچسب داشتن، باز هم CASPER تونست 20 درصد بهتر از مدل‌های رقیب کار کنه! یعنی با یک چهارم داده برچسب‌خورده هم حسابی جواب داده.

آخرش این که این روش می‌تونه یه مسیر جدید بسازه برای سیستم‌های کشف تقلب تو حوزه ارزدیجیتال. چون هم هزینه کمتری داره (چون لازم نیست همه داده‌ها برچسب بخورن) و هم راحت می‌تونه واسه سیستم‌های بزرگتر و مقیاس‌پذیر پیاده بشه. خلاصه اگر قراره کلاهبردارای پانزی تو بلاکچین راحت نباشن، احتمالاً با تکنیک‌هایی مثل CASPER حسابی گیر می‌افتن!

به این می‌گن هوش مصنوعی به کمک امنیت سرمایه‌گذاری!

منبع: +