بذار اول یه چیزی رو روشن کنم: بازار ارز دیجیتال خیلی سریع داره رشد میکنه و هر روز کلی نوآوری و تکنولوژی جدید میاد وسط، مخصوصاً با چیزایی مثل بلاکچین. اما خب قاعدتاً هر چی تکنولوژی جلو بره، کلاهبردارها هم زرنگتر میشن! یکی از شگردهای کلاهبرداری که این روزها بین رمزارزها مد شده، اسمش پانزی هوشمنده یا همون Smart Ponzi Scheme (یعنی طرح پانزی که با قرارداد هوشمند کار میکنه).
حالا طرح پانزی چیه؟ مثل این میمونه که یکی بهت قول سود بالا بده تا تو سرمایهگذاری کنی، ولی واقعیت اینه که پول نفرات جدید رو میگیرن و سود قبلیا رو باهاش میدن؛ یعنی هیچ سرمایهگذاری واقعی تو کار نیست. تو نسخه هوشمندش، این سیستمها توی قراردادهای هوشمند (Smart Contract یعنی کدهای کامپیوتریای که تو بلاکچین اجرا میشن)، پیاده میشن و باعث میشن کسی راحت نتونه این کلاهبرداریها رو جدا کنه از کارای درست.
حالا چالش اصلی اینجاست: تشخیص این پانزیها سخته و روشهای سنتی (که بیشتر مبتنی بر یادگیری عمیق هستن، یعنی استفاده از مدلهای هوش مصنوعی خیلی پیچیده) معمولاً نیاز دارن که کلی داده با برچسب آماده بشه (یعنی مشخص باشه کدوم تراکنش پانزیه و کدوم سالم). این تیپ دادهها اما خیلی کمیابه و همین باعث میشه آموزش دادن مدلها یه کم گیر کنه.
این وسط، پژوهشگرها یه رویکرد باحال و خلاقانه پیشنهاد دادن به اسم «CASPER» (که مخفف Contrastive Approach for Smart Ponzi detectER with more negative samples هست). حالا Contrastive Learning چیه؟ یعنی مدل یه جوری آموزش میبینه که بتونه فرق بین چیزای مشابه و متفاوت رو خوب یاد بگیره، حتی اگه دادههاش بدون برچسب باشن. این طوری مدل میتونه بین کدهای قراردادهای هوشمند، اونایی که پانزی هستن رو از بقیه تشخیص بده، حتی وقتی داده برچسبخورده مخصوص این کار خیلی در دسترس نباشه. تازه، از دادههای بدون برچسب هم به شدت استفاده میکنه و هزینه آموزش مدل رو هم به طور چشمگیری میاره پایین.
یه ویژگی باحال تو CASPER اینه که از «نمونههای منفی بیشتر» استفاده میکنه. یعنی چی؟ یعنی مدل کلی کد یا تراکنش که پانزی نیست رو به عنوان نمونه منفی میبینه تا قدرت تشخیصش بالاتر بره و تو پیدا کردن تقلبیها قویتر عمل کنه.
حالا بیاییم سراغ آزمایشهاش: این روش رو روی دیتاست XBlock تست کردن (XBlock یه مجموعه داده معروف تو حوزه بلاکچین و قراردادهای هوشمنده) و نتیجهها واقعاً امیدوارکننده بودن!
وقتی همه دادهها برچسب داشتن (یعنی مدل با 100 درصد داده برچسبخورده آموزش دید)، CASPER تونست 2.3 درصد بهتر از مدلهای قبلی عمل کنه (اینجا معیارشون F1 Score بوده، که یه جور معیار برای اندازهگیری دقت مدلهاست). ولی اصل غافلگیرکنندهاش اینه که وقتی فقط 25 درصد داده با برچسب داشتن، باز هم CASPER تونست 20 درصد بهتر از مدلهای رقیب کار کنه! یعنی با یک چهارم داده برچسبخورده هم حسابی جواب داده.
آخرش این که این روش میتونه یه مسیر جدید بسازه برای سیستمهای کشف تقلب تو حوزه ارزدیجیتال. چون هم هزینه کمتری داره (چون لازم نیست همه دادهها برچسب بخورن) و هم راحت میتونه واسه سیستمهای بزرگتر و مقیاسپذیر پیاده بشه. خلاصه اگر قراره کلاهبردارای پانزی تو بلاکچین راحت نباشن، احتمالاً با تکنیکهایی مثل CASPER حسابی گیر میافتن!
به این میگن هوش مصنوعی به کمک امنیت سرمایهگذاری!
منبع: +