این روزا دیگه هر کی گوشی دستشه، داره کلی عکس و محتوا میبینه که خیلیاشون با هوش مصنوعی درست شدن. همین موضوع باعث شده تشخیص اینکه یه عکس واقعیه یا هوش مصنوعی ساختهش خیلی سخت بشه. تازه کلی بحث سر درست و سالم بودن محتوای آنلاین هم راه افتاده! حالا بیاید ببینیم دانشمندها واسه این مشکل چه ایده جالبی داشتن.
توی این مقاله، نویسندهها یه روش جدید معرفی کردن که عکسهایی که با هوش مصنوعی تولید شدن رو از عکسهای واقعی جدا کنه. اینجوری خیلی کمک میکنه که بفهمیم کدوم عکسها مصنوعی هستن و جلو سوءاستفاده رو هم بگیریم.
روش پیشنهادیشون یه شبکه عصبی خفن داره که بهش میگن “شبکه چند-حالته برای ترکیب بافت” یا به انگلیسی Multi-modal texture fusion network. معنی سادهش اینه: شبکهای که میتونه اطلاعات مختلف از یه عکس رو همزمان بگیره و با هم ترکیب کنه تا بتونه خیلی دقیقتر تفاوتهای ریز رو پیدا کنه.
حالا این شبکه چیا رو با هم ترکیب میکنه؟
۱. یه ورودی خودش تصویر معمولی RGB هست (همون عکسی که میبینیم، یعنی ترکیب قرمز، سبز و آبی).
۲. یه نقشه به اسم LBP اضافه میکنن – این LBP، یه روشیه که میاد بافتهای خیلی کوچیک و ریز رو توی عکس در میاره و نشون میده. (LBP یعنی Local Binary Pattern، یعنی شناسایی الگوهای باینری کوچیک تو هر نقطه از عکس)
۳. یه ماتریس دیگه به اسم GLCM وارد کار میشه – اینم کلی اطلاعات آماری دربارهی بافتهای عکس میده. (GLCM یا Gray-Level Co-occurrence Matrix یعنی ماتریسی که معلوم میکنه کدوم مقدار رنگ یا سایه توی عکس، کنار بقیه مقدارها چند بار تکرار شده و خلاصه روابط بافت رو حساب میکنه)
این سه تا ورودی رو به صورت موازی وارد یه شبکه عصبی کانولوشنی (Convolutional Neural Network یا همون شبکههایی که برای پردازش تصویر استفاده میشن) میکنن – تازه جالبیش اینه که وزنها (یعنی پارامترهای شبکه) بین این سه شاخه مشترکن. بعد، اطلاعات هر سه شاخه رو با هم ترکیب میکنن و یه نگاه کامل به همه بافتها و جزئیات عکس پیدا میکنن.
نتیجه؟ طبق آزمایشهایی که رو کلی دیتاست استاندارد (دیتاست یعنی مجموعه عکسهای خیلی زیاد برای تست و آموزش الگوریتمها) انجام دادن، این روش به طور قابل توجهی بهتر از مدلهایی که فقط از یه جور ورودی (مثلا فقط عکس RGB یا فقط LBP) استفاده میکنن جواب داده. یعنی هم دقت بالاتره، هم عکسهایی که با مدلهای مختلف هوش مصنوعی تولید شدن رو خیلی بهتر پیدا میکنه و اعتماد بهش بالاس.
مزیت دیگه این شبکه اینه که نه فقط سریع و بهینهست، بلکه نتیجهش خیلی شفاف و قابل تفسیره، یعنی میتونیم راحتتر بفهمیم چرا داره یه عکس رو مصنوعی تشخیص میده.
در کل، اگه لازم باشه عکسهای جعلی که با هوش مصنوعی ساخته شدن رو پیدا کنی و دنبال روشی مطمئن، دقیق و سریع هستی، این روش ترکیبی چند-حالته که دانشمندها معرفی کردن، واقعاً میتونه کارت رو راه بندازه!
منبع: +