قدم به قدم با مغز: یه نگاه خفن به آموزش مدل‌های زبانی با روش عمق فکر!

آقا شنیدی درباره‌ی این مدل‌های زبان خیلی خفن که دارن دنیا رو می‌گیرن؟ مثلاً همین ChatGPT که داری الان باهاش صحبت می‌کنی؟ یکی از چالش‌هاشون اینه که چطور یادشون بدیم سخت‌ترین سوالات رو هم مثل یه آدم باهوش و عمیق حل کنن. یه تیم از دانشمندها اومدن یه ایده‌ی توپ دادن که می‌خوام خیلی دوستانه برات تعریف کنم.

ببین، موقع آموزش این مدل‌ها، باید براشون مثل مدرسه برنامه‌ریزی کنیم. یعنی یه سری سوال آسون تا سخت جلوشون بذاریم. این کار رو بهش میگن «Curriculum Learning» یا همون یادگیری برنامه‌مند. اما سوال اینجاست که از کجا بفهمیم یه سوال واقعاً سخته یا آسون؟

اینا اومدن گفتن: آسون‌ترین راه، اینه که ببینیم آدم‌ها برای حلش چند مرحله باید فکر کنن. به این میگن “Depth of Thought” یا همون «عمق فکر». یعنی هرچی مراحل فکر کردن بیشتر باشه، سوال سخت‌تره. مثلاً اگه یه سوال با دو تا فکر حل بشه، از اون یکی که باید ده تا قدم فکری براش برداری، راحت‌تره!

حالا اینا اومدن و گفتن وقتی مدل رو آموزش می‌دیم، از سوال‌های کم‌عمق (آسون) شروع کنیم و یواش یواش بریم سراغ سوال‌هایی که عمق فکر بیشتری می‌طلبن. مثل وقتی مدرسه می‌ری، اول جمع و تفریق یاد می‌گیری، بعدش می‌ری سراغ مشتق و انتگرال!

جالب اینجاست که این تیم سه تا فرضیه (یا همون ایده‌هایی که میشه امتحانشون کرد) مطرح کردن:

اولی اینکه اصلاً این عمق فکر، با سختی واقعی سوالات (اون جور که مثلاً تو آزمون‌ها و بنچمارک‌ها می‌سنجن – بنچمارک یعنی یه سری تست خاص که سختی و استانداردش رو می‌دونن) همبستگی داره یا نه.
دومین نکته: اگه بر اساس عمق فکر برنامه‌ریزی کنیم، مدل بهتر یاد می‌گیره تا اینکه بیایم سرفصل‌ها رو صرفاً بر اساس طول سوال یا نمره‌ای که داورها می‌دن بچینیم.
سومی هم اینه که این سیستم با مدل‌های مختلف معلمه (Teacher Model – همون مدل‌هایی که جواب درست رو به مدل اصلی یاد می‌دن) قابل اجراست و خیلی وابسته به یکی نیست، فقط کافیه یه کم فرمت جواب‌ها رو رعایت کنیم.

برای اینکه قضیه خیلی علمی و باکلاس باشه، یه چارچوب مشخص برای ارزیابی پیشنهاد دادن تا بشه سنجید واقعاً این راهکار جواب می‌ده یا نه. تازه مشکلات احتمالی رو هم در نظر گرفتن. مثلاً اینکه شاید مدل معلم سبک خاصی تو نوشتن جواب داره و این ویژگیش باعث بشه نتیجه‌ها دقیق نباشه، یا اینکه گاهی طول جواب با عمق فکر قاطی می‌شه و باید حواسمون باشه اینا رو قاطی نکنیم!

در کل اگر بخوام خلاصه کنم: این کار می‌خواد آموزش مدل‌های هوش مصنوعی رو یه ذره شبیه تربیت ذهن انسان بکنه، یعنی مدل رو مرحله به مرحله با سوال‌های عمیق‌تر به چالش بکشه. این‌طوری هم مدل‌هامون بهتر می‌شن و هم روند یادگیریشون قابل فهم و کنترل‌تر می‌شه؛ نه اینکه یه جعبه سیاه باشن که فقط قیافه‌شون شیکه!

راستی، این تیٔوری و روش رو می‌خوان تو دنیای مدل‌های زبانی (LLM – Large Language Models یعنی مدل‌های بزرگ زبانی) پیاده کنن تا موقع آموزش واقعاً قدم به قدم مثل ذهن انسان پیش بره و به سوالای استدلالی سخت جواب بده. خلاصه با این روش، هوش مصنوعی‌ها قراره باهوش‌تر، قوی‌تر و قابل فهم‌تر بشن!

منبع: +