اگه اهل هوش مصنوعی و بحثهای جدیدش باشی، حتما اسم هایپرنتورک به گوشت خورده. اگه نه، همینجا یه توضیح کوچیک بدم: هایپرنتورک یعنی یه شبکه عصبی که خودش میتونه شبکه عصبی دیگهای بسازه و وزنهاش رو تولید کنه. خلاصه بگم، یه مدل هوشمنده که خودش مدل میسازه! خیلی باحاله اما تا الان تحقیق درست و حسابی روش انجام نشده بود. یکی از دلایلش هم این بوده که منابع و دیتاستهای کافی براش موجود نبوده.
حالا خبر خوب: یه تیم باحال اومدن و برای اولین بار یه دیتاست بزرگ از شبکههای عصبی ساختن که تمام هدفش کمک به تحقیقات هایپرنتورکهاست. بزن بریم ببینیم قضیه چیه!
واسه این دیتاست، ۱۰ هزار (بله درست شنیدی!) مدل LeNet-5 رو جمعآوری کردن. LeNet-5 یه معماری خیلی محبوب برای کارهای تشخیص تصویر هست (خودش نوعی از شبکه عصبیه که مخصوص شناسایی تصویر کار میکنه). هر کدوم از این مدلهای LeNet روی یه کار دوتایی آموزش دیدن، یعنی باید بین دو تا کلاس تصویر فرق بذاره. اما اینجا داستان جالبتر میشه: کل دیتاست رو به ۱۰ کلاس مختلف تقسیم کردن، و برای هر کلاس دقیقاً ۱۰۰۰ تا مدل جداگانه ساختن که فقط همون یه کلاس خاص رو از بقیه تشخیص بده. مثلاً یه دسته فقط مخصوص تشخیص سگ از بقیه، یه دسته مخصوص گربه، و همینطور تا ۱۰ تا کلاس متفاوت. این کلاسها رو هم از دیتاست ImageNette V2 انتخاب کردن که یه نسخه سبکتر و جمع و جورتر از ImageNet معروفه.
برای ساخت این دیتاست عظیم، تیم بیشتر از ۱۰ هزار هسته کامپیوتری (core، یعنی واحد پردازش توی کامپیوتر که هرچی بیشتر باشه، سریعتر پردازش میشه) استفاده کردن. خودت حساب کن چقدر قدرت لازم بوده!
تازه، یه تست ساده روی کل این دیتاست زدن و فهمیدن که اگه این شبکهها رو با یه الگوریتم یادگیری ماشین طبقهبندی (کلاسهبندی) کنی، حدود ۷۲ درصد مواقع درست تشخیص میده که هر شبکه واسه کدوم کلاس ساخته شده. این یعنی فرقهای بین این مدلها اونقدر واضح هست که یه الگوریتم یادگیری ماشین معمولی هم میتونه تشخیص بده. کلاً طبقهبندی یعنی اینکه یه سیستم اتومات بتونه بگه هر چیزی (مثلاً یه عکس یا حتی یه شبکه عصبی) متعلق به چه دستهایه.
هدف اصلی این دیتاست اینه که محققها بتونن تحقیقات هایپرنتورک رو راحتتر انجام بدن. مثلاً تست کنن که یک هایپرنتورک واقعاً میتونه وزنهای مدلهای مختلف رو تولید کنه یا نه. اما مهمتر از همه اینه که هم خود دیتاست و هم کدهای مربوط به ساختش کاملاً اوپن و رایگان در دسترس عموم قرار گرفته. یعنی هرکی بخواد میتونه دانلود کنه و باهاش کار کنه (Open source یعنی منبع باز و برای همه قابل استفاده).
پس اگه دنبال چالشی جدید توی هوش مصنوعی هستی یا میخوای تو زمینه هایپرنتورک یه قدم جدی برداری، این دیتاست طلایی رو به هیچوجه از دست نده! کلی ایده و کار خفن میشه باهاش کرد. 😎
منبع: +