هوش مصنوعی جدید: یادگیری ماشین خودکار که با حرف زدن کارتو راه می‌اندازه!

بیا یه چیز باحال رو معرفی کنم که خیلی از دردسرای یادگیری ماشین (همون ML، یعنی ساخت مدل‌هایی که خودشون داده رو تحلیل می‌کنن) رو برای همه آسون کرده؛ حتی اگه توش حرفه‌ای نباشی! اسمش هست AutoML، یعنی یادگیری ماشین خودکار. کلاً قرار بود AutoML بیاد همه مراحل ساخت و آموزش مدل رو اتوماتیک کنه. ولی خب، بیشتر این ابزارای قبلی یه مشکل داشتن: خیلی قانون‌محور (یا همون rule-based) بودن و باید ورودی‌ها خیلی منظم و ساختارمند باشه. همین باعث می‌شد بیشتر آدمای عادی نتونن باهاش کار کنن.

ولی اینجا یه خبر توپ دارم: دانشمندها اومدن یه هوش مصنوعی ساختن که قلب تپنده‌ش Large Language Model (LLM)ـه. مثلاً یکی از معروف‌ترین‌هاش همون ChatGPTه! LLMها رو قبلاً بیشتر برای فهمیدن زبان طبیعی (مثل انگلیسی حرف زدن) و تولید کد دیدیم. اما حالا دارن توی AutoML هم غوغا می‌کنن.

حالا این هوش مصنوعی جدید چیکار می‌کنه؟ کافی فقط باهاش حرف بزنی (اونم با زبون طبیعی، نه با کد یا فرمول عجیب‌غریب)، بعد خودش همه مراحل یادگیری ماشین رو تا ته میره:

داده‌هات رو خودش لود و پیش‌پردازش می‌کنه (پیش‌پردازش یعنی داده‌ها رو تمیز و آماده‌ی مدل‌سازی می‌کنه)
تشخیص می‌ده کدوم کار باید انجام بشه (مثلاً طبقه‌بندی کردن یا پیش‌بینی عددی)
معماری مناسب شبکه عصبی رو خودش انتخاب می‌کنه (شبکه عصبی یعنی همون مدل‌های یادگیری عمیق جالب)
تنظیمات هایپرپارامترها رو خودش بهینه می‌کنه (هایپرپارامتر یعنی تنظیمات جزئی مدل که تاثیر زیادی روی کیفیتش دارن)
کل فرآیند آموزش رو هم خودش اتوماتیک پیش می‌بره

یه نوآوری جالب دیگه هم هست: قبلاً آدم‌ها مجبور بودن داده‌هاشونو دستی تمیز کنن یا تبدیل فرمت کنن تا مدل متوجه شه. اما این مدل جدید با استفاده از قدرت LLMها خودش می‌فهمه داده‌ها به چه صورتی هستن، فرقی هم نمی‌کنه چند نوع داده مختلف داشته باشی! یعنی خداحافظ با تبدیل فرمت‌های عجیب و پردردسر.

در مورد بهینه‌سازی هم خیلی حرفه‌ای عمل می‌کنه؛ یعنی نه مثل یه الگوریتم خشک که فقط بر اساس یه سری قانون حرکت کنه. بلکه خودش با استفاده از دانش LLM (درباره بهترین روش‌های ML) و بازخوردی که از عملکرد مدل می‌گیره، می‌فهمه چه جوری باید دایره جستجوی تنظیمات رو هی هوشمندانه عوض کنه. (به این کار می‌گن adaptive hyperparameter optimization، یعنی بهینه‌سازی تنظیمات مدل به‌صورت تطبیقی و هوشمند)

برای اینکه ببینن واقعاً خوب کار می‌کنه یا نه، این سیستم رو روی ۱۰ تا دیتاست مختلف تست کردن؛ هم برای طبقه‌بندی (تشخیص دسته‌بندی، مثل تعیین اینکه یه ایمیل اسپمه یا نه) و هم برای رگرسیون (پیش‌بینی مقدار عددی، مثلاً قیمت خونه). تازه دیتاهاشون هم انواع و اقسام بودن! نتیجه؟ این سیستم توی اکثر مواقع بهتر از سیستم‌های اتومات با قوانین ثابت عمل کرد.

در واقع، این روش جدید باعث شده که فاصله بین نیت انسان (چی می‌خوای) و اجرای مدل ML (چجوری باید انجام بشه) خیلی خیلی کمتر شه؛ یعنی دیگه لازم نیست متخصص باشی تا بتونی از قدرت یادگیری ماشین استفاده کنی. خلاصه که AutoML داره حسابی انسان‌محور و کاربرپسند میشه، مخصوصاً با کمک LLMها!

منبع: +