دیتاست خفن شبکه‌های عصبی برای عاشقان هایپرنتورک‌ها!

Fall Back

اگه اهل هوش مصنوعی و بحث‌های جدیدش باشی، حتما اسم هایپرنتورک به گوشت خورده. اگه نه، همین‌جا یه توضیح کوچیک بدم: هایپرنتورک یعنی یه شبکه عصبی که خودش می‌تونه شبکه عصبی دیگه‌ای بسازه و وزن‌هاش رو تولید کنه. خلاصه بگم، یه مدل هوشمنده که خودش مدل می‌سازه! خیلی باحاله اما تا الان تحقیق درست و حسابی روش انجام نشده بود. یکی از دلایلش هم این بوده که منابع و دیتاست‌های کافی براش موجود نبوده.

حالا خبر خوب: یه تیم باحال اومدن و برای اولین بار یه دیتاست بزرگ از شبکه‌های عصبی ساختن که تمام هدفش کمک به تحقیقات هایپرنتورک‌هاست. بزن بریم ببینیم قضیه چیه!

واسه این دیتاست، ۱۰ هزار (بله درست شنیدی!) مدل LeNet-5 رو جمع‌آوری کردن. LeNet-5 یه معماری خیلی محبوب برای کارهای تشخیص تصویر هست (خودش نوعی از شبکه عصبیه که مخصوص شناسایی تصویر کار می‌کنه). هر کدوم از این مدل‌های LeNet روی یه کار دوتایی آموزش دیدن، یعنی باید بین دو تا کلاس تصویر فرق بذاره. اما اینجا داستان جالب‌تر میشه: کل دیتاست رو به ۱۰ کلاس مختلف تقسیم کردن، و برای هر کلاس دقیقاً ۱۰۰۰ تا مدل جداگانه ساختن که فقط همون یه کلاس خاص رو از بقیه تشخیص بده. مثلاً یه دسته فقط مخصوص تشخیص سگ از بقیه، یه دسته مخصوص گربه، و همین‌طور تا ۱۰ تا کلاس متفاوت. این کلاس‌ها رو هم از دیتاست ImageNette V2 انتخاب کردن که یه نسخه سبک‌تر و جمع‌ و جورتر از ImageNet معروفه.

برای ساخت این دیتاست عظیم، تیم بیشتر از ۱۰ هزار هسته کامپیوتری (core، یعنی واحد پردازش توی کامپیوتر که هرچی بیشتر باشه، سریع‌تر پردازش می‌شه) استفاده کردن. خودت حساب کن چقدر قدرت لازم بوده!

تازه، یه تست ساده روی کل این دیتاست زدن و فهمیدن که اگه این شبکه‌ها رو با یه الگوریتم یادگیری ماشین طبقه‌بندی (کلاسه‌بندی) کنی، حدود ۷۲ درصد مواقع درست تشخیص میده که هر شبکه واسه کدوم کلاس ساخته شده. این یعنی فرق‌های بین این مدل‌ها اونقدر واضح هست که یه الگوریتم یادگیری ماشین معمولی هم می‌تونه تشخیص بده. کلاً طبقه‌بندی یعنی اینکه یه سیستم اتومات بتونه بگه هر چیزی (مثلاً یه عکس یا حتی یه شبکه عصبی) متعلق به چه دسته‌ایه.

هدف اصلی این دیتاست اینه که محقق‌ها بتونن تحقیقات هایپرنتورک رو راحت‌تر انجام بدن. مثلاً تست کنن که یک هایپرنتورک واقعاً می‌تونه وزن‌های مدل‌های مختلف رو تولید کنه یا نه. اما مهم‌تر از همه اینه که هم خود دیتاست و هم کدهای مربوط به ساختش کاملاً اوپن و رایگان در دسترس عموم قرار گرفته. یعنی هرکی بخواد می‌تونه دانلود کنه و باهاش کار کنه (Open source یعنی منبع باز و برای همه قابل استفاده).

پس اگه دنبال چالشی جدید توی هوش مصنوعی هستی یا می‌خوای تو زمینه هایپرنتورک یه قدم جدی برداری، این دیتاست طلایی رو به هیچ‌وجه از دست نده! کلی ایده و کار خفن میشه باهاش کرد. 😎

منبع: +