بیا یه چیز باحال رو معرفی کنم که خیلی از دردسرای یادگیری ماشین (همون ML، یعنی ساخت مدلهایی که خودشون داده رو تحلیل میکنن) رو برای همه آسون کرده؛ حتی اگه توش حرفهای نباشی! اسمش هست AutoML، یعنی یادگیری ماشین خودکار. کلاً قرار بود AutoML بیاد همه مراحل ساخت و آموزش مدل رو اتوماتیک کنه. ولی خب، بیشتر این ابزارای قبلی یه مشکل داشتن: خیلی قانونمحور (یا همون rule-based) بودن و باید ورودیها خیلی منظم و ساختارمند باشه. همین باعث میشد بیشتر آدمای عادی نتونن باهاش کار کنن.
ولی اینجا یه خبر توپ دارم: دانشمندها اومدن یه هوش مصنوعی ساختن که قلب تپندهش Large Language Model (LLM)ـه. مثلاً یکی از معروفترینهاش همون ChatGPTه! LLMها رو قبلاً بیشتر برای فهمیدن زبان طبیعی (مثل انگلیسی حرف زدن) و تولید کد دیدیم. اما حالا دارن توی AutoML هم غوغا میکنن.
حالا این هوش مصنوعی جدید چیکار میکنه؟ کافی فقط باهاش حرف بزنی (اونم با زبون طبیعی، نه با کد یا فرمول عجیبغریب)، بعد خودش همه مراحل یادگیری ماشین رو تا ته میره:
- دادههات رو خودش لود و پیشپردازش میکنه (پیشپردازش یعنی دادهها رو تمیز و آمادهی مدلسازی میکنه)
- تشخیص میده کدوم کار باید انجام بشه (مثلاً طبقهبندی کردن یا پیشبینی عددی)
- معماری مناسب شبکه عصبی رو خودش انتخاب میکنه (شبکه عصبی یعنی همون مدلهای یادگیری عمیق جالب)
- تنظیمات هایپرپارامترها رو خودش بهینه میکنه (هایپرپارامتر یعنی تنظیمات جزئی مدل که تاثیر زیادی روی کیفیتش دارن)
- کل فرآیند آموزش رو هم خودش اتوماتیک پیش میبره
یه نوآوری جالب دیگه هم هست: قبلاً آدمها مجبور بودن دادههاشونو دستی تمیز کنن یا تبدیل فرمت کنن تا مدل متوجه شه. اما این مدل جدید با استفاده از قدرت LLMها خودش میفهمه دادهها به چه صورتی هستن، فرقی هم نمیکنه چند نوع داده مختلف داشته باشی! یعنی خداحافظ با تبدیل فرمتهای عجیب و پردردسر.
در مورد بهینهسازی هم خیلی حرفهای عمل میکنه؛ یعنی نه مثل یه الگوریتم خشک که فقط بر اساس یه سری قانون حرکت کنه. بلکه خودش با استفاده از دانش LLM (درباره بهترین روشهای ML) و بازخوردی که از عملکرد مدل میگیره، میفهمه چه جوری باید دایره جستجوی تنظیمات رو هی هوشمندانه عوض کنه. (به این کار میگن adaptive hyperparameter optimization، یعنی بهینهسازی تنظیمات مدل بهصورت تطبیقی و هوشمند)
برای اینکه ببینن واقعاً خوب کار میکنه یا نه، این سیستم رو روی ۱۰ تا دیتاست مختلف تست کردن؛ هم برای طبقهبندی (تشخیص دستهبندی، مثل تعیین اینکه یه ایمیل اسپمه یا نه) و هم برای رگرسیون (پیشبینی مقدار عددی، مثلاً قیمت خونه). تازه دیتاهاشون هم انواع و اقسام بودن! نتیجه؟ این سیستم توی اکثر مواقع بهتر از سیستمهای اتومات با قوانین ثابت عمل کرد.
در واقع، این روش جدید باعث شده که فاصله بین نیت انسان (چی میخوای) و اجرای مدل ML (چجوری باید انجام بشه) خیلی خیلی کمتر شه؛ یعنی دیگه لازم نیست متخصص باشی تا بتونی از قدرت یادگیری ماشین استفاده کنی. خلاصه که AutoML داره حسابی انسانمحور و کاربرپسند میشه، مخصوصاً با کمک LLMها!
منبع: +