هوش مصنوعی، دوست خوبمون توی شناسایی حملات فیشینگ!

خب بچه‌ها، بیاید یه خورده با هم درباره یکی از حقه‌های بدجنس دنیای اینترنت حرف بزنیم: فیشینگ! فیشینگ یعنی یه جور حمله سایبری که معمولاً از راه گول زدن آدم‌ها یا همون Social Engineering انجام میشه. طرفای خرابکار میان خودشون رو جای یه آدم یا سازمان معتبر جا می‌زنن و با حقه بازی، سعی میکنن اطلاعات مهم مثل رمز عبور، شماره کارت بانکی یا اطلاعات شرکت رو از زیر زبونمون بکشن بیرون! نکته جالبش اینه که حملات فیشینگ زیاد هم به تکنولوژی‌های خیلی پیشرفته وابسته نیستن و با ساده‌ترین ترفندها می‌تونن کارشون رو راه بندازن.

حالا تو این دنیا که هر روز یه بله جدید از این فیشینگ‌بازها سرمون میاد، باید بگم هوش مصنوعی یا AI اومده و کلی به دادمون رسیده. هوش مصنوعی (همون AI که سر زبون همه‌ست) یعنی کامپیوترها یاد می‌گیرن مثل آدم فکر کنن و تصمیم بگیرن. تو این ماجرا، بیشتر با یادگیری ماشین یا Machine Learning (ML) سر و کار داریم؛ یعنی سیستم‌ها بدون اینکه یکی به یکی بهشون بگی چیکار کنن، خودشون الگوها رو پیدا می‌کنن و بعد سر بزنگاه تشخیص می‌دن کدوم سایت یا ایمیل مشکوکه.

بذار یه کم با مثال برات توضیح بدم: فرض کن یه لینک مشکوک واست ایمیل میشه که میگه سریع رو این کلیک کن تا اکانت اینستاگرامت قفل نشه. AI میاد کلی ویژگی (Feature) از این لینک و متن ایمیل درمیاره—مثلاً دامنه سایت، شکل و شمایل صفحه، طرز نوشتار متن یا حتی اینکه تو جمله‌هاش چندتا غلط وجود داره. بعد با کلی الگوریتم ریز و درشت شروع میکنه سبک‌شناسی و تشخیص!

توی این مسیر کلی تحقیق انجام شده. یه جمع‌بندی کلی نشون داده که از سال ۲۰۱۶ به بعد، هوش مصنوعی توی تشخیص و مبارزه با فیشینگ خیلی رشد داشته و مخصوصاً سال ۲۰۲۴ این ماجرا خیلی جدی‌تر شده. پژوهشگرا راه افتادن سمت روش‌های یادگیری عمیق یا Deep Learning (DL) که یه مدل پیشرفته‌تر از همون یادگیری ماشینه. یادگیری عمیق یعنی مدل‌هایی که می‌تونن خودشون کشف کنن چی مهمه، حتی بدون نیاز به انتخاب دستی ویژگی‌ها.

یه چیز دیگه هم که حسابی روش مانور دادن، بخش انتخاب و مهندسی ویژگی‌ها بوده—یعنی اینکه دقیقاً بدونن باید چه اطلاعاتی از یه لینک یا ایمیل بیرون بکشن تا بتونه گول‌زننده بودنش رو نشون بده. نسل جدیدِ مدل‌ها دارن میرن سمت مدل‌های ترکیبی یا هیبرید (Hybrid Models)، مثلاً ترکیب چندتا مدل یا استک کردن (Classifier Stacking) که نتیجه رو دقیق‌تر کنه.

برای اینکه این موضوع رو قرص و محکم بررسی کنن، گیا از دیتابیس Web of Science (یه جور موتور جستجوی علمی حسابی) رفتن و ۱۰۹۶ تا مقاله رو جمع کردن که هر کدوم درباره هوش مصنوعی، یادگیری ماشین، یادگیری عمیق یا پردازش زبان طبیعی (Natural Language Processing یا NLP) تو زمینه فیشینگ حرف زده بودن. بعد با نرم‌افزارهایی مثل Biblioshiny (که مخصوص تحلیل داده‌های علمی هست) و VOSviewer اومدن این مقالات رو موشکافی کردن.

این تحلیل‌ها نشون داد مثلاً کدوم موضوع‌ها آینده‌دارن، کدوم یکی دیگه داره فراموش میشه یا چه گروهی از پژوهشگرا بیشتر با هم همکاری دارن و سرِ چه موضوعی بیشتر گرمشونه. مثلاً بررسی کردن تو هر دوره زمانی، کدوم کلمات کلیدی پررنگ‌تر شدن و چه تکنیکایی دارن رایج میشن.

در آخر میشه گفت امروزه هوش مصنوعی و همه شاخه‌هاش چه تو تشخیص سریع فیشینگ و چه پیش‌بینی ترفندهای جدید، حسابی جواب داده. ولی خب پیشرفت متوقف نمیشه و همین الانش هم داریم می‌بینیم با ورود مدل‌های یادگیری عمیق (DL)، روش‌های هیبرید و انتخاب ویژگی پیشرفته، دقت تشخیص هر روز بالاتر میره. پس اگه یه روز یه ایمیل عجیب برات اومد و هوش مصنوعی بهت میگه برو کنار، حرفش رو گوش کن!

منبع: +