این پژوهش به بررسی چگونگی تأثیر رویکردهای مختلف تفکر بر پویایی آموزش مدلهای زبانی بزرگ (LLM) در سطح لایه میپردازد. محققان دریافتند که رویکردهای تفکر سریع در مقایسه با روشهای تفکر آهسته، گرادیانهای بزرگتر و تغییرات لایهای بیشتری ایجاد میکنند.
این مطالعه که توسط مینگ لی، یانهونگ لی و تیانیی ژو انجام شده، به طور خاص الگوهای گرادیان را در هنگام آموزش LLMها برای تفکر سریع (پاسخهای مستقیم) در مقابل تفکر آهسته (استدلال زنجیرهای فکر) بررسی میکند.
یافتههای کلیدی نشان میدهد که الگوهای گرادیان میتوانند به طور موثر بین مسیرهای استدلال صحیح و نامربوط در رویکردهای تفکر آهسته تمایز قائل شوند. جالب توجه است که مدلهای از پیش آموزشدیده در مقایسه با همتایان آموزشدیده با دستورالعمل، مقاومت بیشتری در برابر ناپایداریهای تفکر سریع نشان دادند.
این تحقیق بینشهای ارزشمندی را در مورد پویایی آموزش LLM ارائه میدهد و پیامدهای عملی برای توسعه عاملهای سیستم-۲ موثرتر را به همراه دارد. روششناسی کامل، دادهها و آمار گرادیان در گیتهاب (GitHub) در دسترس است.
اگر به خواندن کامل این مطلب علاقهمندید، روی لینک مقابل کلیک کنید: huggingface.co