یه شبکه خفن برای کشف عکس‌های ساخته شده با هوش مصنوعی!

این روزا دیگه هر کی گوشی دستشه، داره کلی عکس و محتوا می‌بینه که خیلیاشون با هوش مصنوعی درست شدن. همین موضوع باعث شده تشخیص اینکه یه عکس واقعیه یا هوش مصنوعی ساخته‌ش خیلی سخت بشه. تازه کلی بحث سر درست و سالم بودن محتوای آنلاین هم راه افتاده! حالا بیاید ببینیم دانشمندها واسه این مشکل چه ایده جالبی داشتن.

توی این مقاله، نویسنده‌ها یه روش جدید معرفی کردن که عکس‌هایی که با هوش مصنوعی تولید شدن رو از عکس‌های واقعی جدا کنه. این‌جوری خیلی کمک می‌کنه که بفهمیم کدوم عکس‌ها مصنوعی هستن و جلو سوءاستفاده رو هم بگیریم.

روش پیشنهادی‌شون یه شبکه عصبی خفن داره که بهش میگن “شبکه چند-حالته برای ترکیب بافت” یا به انگلیسی Multi-modal texture fusion network. معنی ساده‌ش اینه: شبکه‌ای که می‌تونه اطلاعات مختلف از یه عکس رو همزمان بگیره و با هم ترکیب کنه تا بتونه خیلی دقیق‌تر تفاوت‌های ریز رو پیدا کنه.

حالا این شبکه چیا رو با هم ترکیب می‌کنه؟
۱. یه ورودی خودش تصویر معمولی RGB هست (همون عکسی که می‌بینیم، یعنی ترکیب قرمز، سبز و آبی).
۲. یه نقشه به اسم LBP اضافه می‌کنن – این LBP، یه روشیه که میاد بافت‌های خیلی کوچیک و ریز رو توی عکس در میاره و نشون می‌ده. (LBP یعنی Local Binary Pattern، یعنی شناسایی الگوهای باینری کوچیک تو هر نقطه از عکس)
۳. یه ماتریس دیگه به اسم GLCM وارد کار میشه – اینم کلی اطلاعات آماری درباره‌ی بافت‌های عکس می‌ده. (GLCM یا Gray-Level Co-occurrence Matrix یعنی ماتریسی که معلوم می‌کنه کدوم مقدار رنگ یا سایه توی عکس، کنار بقیه مقدارها چند بار تکرار شده و خلاصه روابط بافت رو حساب می‌کنه)

این سه تا ورودی رو به صورت موازی وارد یه شبکه عصبی کانولوشنی (Convolutional Neural Network یا همون شبکه‌هایی که برای پردازش تصویر استفاده میشن) می‌کنن – تازه جالبیش اینه که وزن‌ها (یعنی پارامترهای شبکه) بین این سه شاخه مشترکن. بعد، اطلاعات هر سه شاخه رو با هم ترکیب می‌کنن و یه نگاه کامل به همه بافت‌ها و جزئیات عکس پیدا می‌کنن.

نتیجه؟ طبق آزمایش‌هایی که رو کلی دیتاست استاندارد (دیتاست یعنی مجموعه عکس‌های خیلی زیاد برای تست و آموزش الگوریتم‌ها) انجام دادن، این روش به طور قابل توجهی بهتر از مدل‌هایی که فقط از یه جور ورودی (مثلا فقط عکس RGB یا فقط LBP) استفاده می‌کنن جواب داده. یعنی هم دقت بالاتره، هم عکس‌هایی که با مدل‌های مختلف هوش مصنوعی تولید شدن رو خیلی بهتر پیدا می‌کنه و اعتماد بهش بالاس.

مزیت دیگه این شبکه اینه که نه فقط سریع و بهینه‌ست، بلکه نتیجه‌ش خیلی شفاف و قابل تفسیره، یعنی می‌تونیم راحت‌تر بفهمیم چرا داره یه عکس رو مصنوعی تشخیص می‌ده.

در کل، اگه لازم باشه عکس‌های جعلی که با هوش مصنوعی ساخته شدن رو پیدا کنی و دنبال روشی مطمئن، دقیق و سریع هستی، این روش ترکیبی چند-حالته که دانشمندها معرفی کردن، واقعاً می‌تونه کارت رو راه بندازه!

منبع: +