چطوری مدل‌های زبانی بزرگ دارن یادگیری ماشین رو برای همه آسون می‌کنن!

اگه تا حالا با یادگیری ماشین (همون Machine Learning که بهش ML هم می‌گن) سروکله زده باشی، حتماً می‌دونی که اجرای پروژه‌هاش اصلاً شوخی نیست. یعنی معمولاً کار تکنیکی و پیچیده‌ایه و خیلی از آدم‌ها و شرکت‌ها باهاش مشکل دارن. حتی کسایی که خیلی پایه‌ش قوی نیست یا تازه باهاش آشنا شدن، ممکنه گیج بشن و هی استرس بگیرن. اینجا بود که محقق‌ها اومدن روی یه ایده جدید کار کنن: استفاده از مدل‌های زبانی بزرگ مثل ChatGPT و هم‌خونواده‌هاش برای آسون‌تر کردن یادگیری ماشین با یه رابط کاربری که انگلیسی عادی (یا زبون آدمیزاد!) می‌فهمه.

حالا چی شد؟ بیاید با هم نتیجه تحقیقشون رو مرور کنیم:

اول یه توضیح کوتاه بدم: مدل‌های زبانی بزرگ (LLMs یعنی Large Language Models)، همون هوش مصنوعی‌های باحالی‌ان که می‌تونن متن بنویسن، به سوال جواب بدن و خلاصه با زبون آدم‌ها حرف بزنن. این داستان مخصوصاً تو قسمت اتوML (AutoML: یعنی ابزاری که خودش کلی کار مهندسی یادگیری ماشین رو اتومات انجام میده و باعث میشه لازم نباشه دیتاساینتیست حرفه‌ای باشی) خیلی جالب شده!

توی تحقیقشون، اومدن یه سری آدم حرفه‌ای از نقش‌های مختلف – یعنی همه‌طور آدما، نه فقط برنامه‌نویس‌ها – رو جمع کردن (۱۵ نفر از تخصص‌ها و زمینه‌های تکنیکی و غیرتکنیکی مختلف) و کاری کردن تا با دو روش مختلف سر و کله بزنن: یکی با روش سنتی پیاده‌سازی ML و یکی با این مدل جدید AutoML که LLM محور بود.

نتایج؟ خودش یه عالَمه حرف واسه گفتن داره!

۱. موفقیت چشمگیر با مدل زبانی بزرگ: توی شرایطی که افراد فقط با همین سیستم LLM-محور کار می‌کردن، ۹۳.۳۴٪ کسایی که تست شدن تونستن نتایج خیلی بهتری بگیرن! یعنی دیگه همه یه حس خفن و موفقیت داشتن. تو این بین تقریباً نصف‌ها (46.67٪) تونستن دقت پیش‌بینی رو ۱۰ تا ۲۵ درصد بیشتر کنن، نصف دیگه واقعاً ترکوندن یعنی بالای ۲۵ درصد پیشرفت نسبت به حالت معمول داشتن. فقط یه تعداد خیلی کم (۶.۶۷٪) بودن که مثل روش قبل باقی موندن و فرقی حس نکردن.

۲. زمان توسعه پروژه نصف شد: حدود ۶۰٪ شرکت‌کننده‌ها گفتن زمان کارشون خیلی کمتر شد و کلی در وقت و انرژی صرفه‌جویی کردن. در کل، این مدل جدید تونسته زمان پیاده‌سازی پروژه یادگیری ماشین رو تا ۵۰٪ کاهش بده – یعنی یه پروژه دوماهه رو در یکی دو هفته تموم می‌کنی!

۳. پُلی بین حرفه‌ای‌ها و تازه‌کارها: یکی از مهم‌ترین بخش‌ها این بود که این رابط زبانی طبیعی (Natural Language Interface: یعنی ارتباط راحت مثل گپ زدن با یه آدم) باعث شده بود فاصله سطح فنی افراد کم شه. قبلاً همه فکر می‌کردن باید برنامه‌نویس حرفه‌ای باشی، اما الان سطح تخصص مهم نیست، دقت پروژه بالا میره.

۴. خطا رو سریع‌تر حل کن، یادگیری سریع‌تر: با این روش جدید، حتی وقتی موقع پیاده‌سازی به مشکل می‌خوردن، زمان رفع خطاها یهویی ۷۳٪ سریع‌تر شد! خلاصه کسی دیگه ساعت‌ها تو کد و ارور گم نمی‌شد. در ضمن آموزش و جا افتادن سیستم هم خیلی سریع‌تر انجام می‌شد و آدم‌ها خیلی زودتر تو دل کار می‌افتادن.

۵. راه دمکراتیک برای همه و بدون قربانی کردن کیفیت: یکی دیگه از نتایج جالب، اینکه روش LLM محور تونست کیفیت و عملکرد پروژه‌ها رو بالا نگه داره و در عین حال همه‌کس‌فهم باشه؛ یعنی لازم نیست نخبه باشی تا ازش نتیجه بگیری.

در کل، این تحقیق نوید روزی رو میده که هر کسی تو شرکت‌ها، از هر سطح فنی، می‌تونه با قدرت ML کار کنه – فقط کافی یه کم باهاش آشنا بشه و حتی با انگلیسی عادی با سیستم صحبت کنه. این یعنی دنیای یادگیری ماشین داره از یه سیاره مرموز مخصوص نخبه‌ها بیرون میاد و برای همه باز میشه! واقعاً هیجان‌انگیزه؛ مخصوصاً اگه دوست داری با ML کار کنی ولی همیشه فنی بودن کارا می‌ترسوندت!

منبع: +