خب بچهها، بیاید یه خورده با هم درباره یکی از حقههای بدجنس دنیای اینترنت حرف بزنیم: فیشینگ! فیشینگ یعنی یه جور حمله سایبری که معمولاً از راه گول زدن آدمها یا همون Social Engineering انجام میشه. طرفای خرابکار میان خودشون رو جای یه آدم یا سازمان معتبر جا میزنن و با حقه بازی، سعی میکنن اطلاعات مهم مثل رمز عبور، شماره کارت بانکی یا اطلاعات شرکت رو از زیر زبونمون بکشن بیرون! نکته جالبش اینه که حملات فیشینگ زیاد هم به تکنولوژیهای خیلی پیشرفته وابسته نیستن و با سادهترین ترفندها میتونن کارشون رو راه بندازن.
حالا تو این دنیا که هر روز یه بله جدید از این فیشینگبازها سرمون میاد، باید بگم هوش مصنوعی یا AI اومده و کلی به دادمون رسیده. هوش مصنوعی (همون AI که سر زبون همهست) یعنی کامپیوترها یاد میگیرن مثل آدم فکر کنن و تصمیم بگیرن. تو این ماجرا، بیشتر با یادگیری ماشین یا Machine Learning (ML) سر و کار داریم؛ یعنی سیستمها بدون اینکه یکی به یکی بهشون بگی چیکار کنن، خودشون الگوها رو پیدا میکنن و بعد سر بزنگاه تشخیص میدن کدوم سایت یا ایمیل مشکوکه.
بذار یه کم با مثال برات توضیح بدم: فرض کن یه لینک مشکوک واست ایمیل میشه که میگه سریع رو این کلیک کن تا اکانت اینستاگرامت قفل نشه. AI میاد کلی ویژگی (Feature) از این لینک و متن ایمیل درمیاره—مثلاً دامنه سایت، شکل و شمایل صفحه، طرز نوشتار متن یا حتی اینکه تو جملههاش چندتا غلط وجود داره. بعد با کلی الگوریتم ریز و درشت شروع میکنه سبکشناسی و تشخیص!
توی این مسیر کلی تحقیق انجام شده. یه جمعبندی کلی نشون داده که از سال ۲۰۱۶ به بعد، هوش مصنوعی توی تشخیص و مبارزه با فیشینگ خیلی رشد داشته و مخصوصاً سال ۲۰۲۴ این ماجرا خیلی جدیتر شده. پژوهشگرا راه افتادن سمت روشهای یادگیری عمیق یا Deep Learning (DL) که یه مدل پیشرفتهتر از همون یادگیری ماشینه. یادگیری عمیق یعنی مدلهایی که میتونن خودشون کشف کنن چی مهمه، حتی بدون نیاز به انتخاب دستی ویژگیها.
یه چیز دیگه هم که حسابی روش مانور دادن، بخش انتخاب و مهندسی ویژگیها بوده—یعنی اینکه دقیقاً بدونن باید چه اطلاعاتی از یه لینک یا ایمیل بیرون بکشن تا بتونه گولزننده بودنش رو نشون بده. نسل جدیدِ مدلها دارن میرن سمت مدلهای ترکیبی یا هیبرید (Hybrid Models)، مثلاً ترکیب چندتا مدل یا استک کردن (Classifier Stacking) که نتیجه رو دقیقتر کنه.
برای اینکه این موضوع رو قرص و محکم بررسی کنن، گیا از دیتابیس Web of Science (یه جور موتور جستجوی علمی حسابی) رفتن و ۱۰۹۶ تا مقاله رو جمع کردن که هر کدوم درباره هوش مصنوعی، یادگیری ماشین، یادگیری عمیق یا پردازش زبان طبیعی (Natural Language Processing یا NLP) تو زمینه فیشینگ حرف زده بودن. بعد با نرمافزارهایی مثل Biblioshiny (که مخصوص تحلیل دادههای علمی هست) و VOSviewer اومدن این مقالات رو موشکافی کردن.
این تحلیلها نشون داد مثلاً کدوم موضوعها آیندهدارن، کدوم یکی دیگه داره فراموش میشه یا چه گروهی از پژوهشگرا بیشتر با هم همکاری دارن و سرِ چه موضوعی بیشتر گرمشونه. مثلاً بررسی کردن تو هر دوره زمانی، کدوم کلمات کلیدی پررنگتر شدن و چه تکنیکایی دارن رایج میشن.
در آخر میشه گفت امروزه هوش مصنوعی و همه شاخههاش چه تو تشخیص سریع فیشینگ و چه پیشبینی ترفندهای جدید، حسابی جواب داده. ولی خب پیشرفت متوقف نمیشه و همین الانش هم داریم میبینیم با ورود مدلهای یادگیری عمیق (DL)، روشهای هیبرید و انتخاب ویژگی پیشرفته، دقت تشخیص هر روز بالاتر میره. پس اگه یه روز یه ایمیل عجیب برات اومد و هوش مصنوعی بهت میگه برو کنار، حرفش رو گوش کن!
منبع: +