آقا شنیدی دربارهی این مدلهای زبان خیلی خفن که دارن دنیا رو میگیرن؟ مثلاً همین ChatGPT که داری الان باهاش صحبت میکنی؟ یکی از چالشهاشون اینه که چطور یادشون بدیم سختترین سوالات رو هم مثل یه آدم باهوش و عمیق حل کنن. یه تیم از دانشمندها اومدن یه ایدهی توپ دادن که میخوام خیلی دوستانه برات تعریف کنم.
ببین، موقع آموزش این مدلها، باید براشون مثل مدرسه برنامهریزی کنیم. یعنی یه سری سوال آسون تا سخت جلوشون بذاریم. این کار رو بهش میگن «Curriculum Learning» یا همون یادگیری برنامهمند. اما سوال اینجاست که از کجا بفهمیم یه سوال واقعاً سخته یا آسون؟
اینا اومدن گفتن: آسونترین راه، اینه که ببینیم آدمها برای حلش چند مرحله باید فکر کنن. به این میگن “Depth of Thought” یا همون «عمق فکر». یعنی هرچی مراحل فکر کردن بیشتر باشه، سوال سختتره. مثلاً اگه یه سوال با دو تا فکر حل بشه، از اون یکی که باید ده تا قدم فکری براش برداری، راحتتره!
حالا اینا اومدن و گفتن وقتی مدل رو آموزش میدیم، از سوالهای کمعمق (آسون) شروع کنیم و یواش یواش بریم سراغ سوالهایی که عمق فکر بیشتری میطلبن. مثل وقتی مدرسه میری، اول جمع و تفریق یاد میگیری، بعدش میری سراغ مشتق و انتگرال!
جالب اینجاست که این تیم سه تا فرضیه (یا همون ایدههایی که میشه امتحانشون کرد) مطرح کردن:
- اولی اینکه اصلاً این عمق فکر، با سختی واقعی سوالات (اون جور که مثلاً تو آزمونها و بنچمارکها میسنجن – بنچمارک یعنی یه سری تست خاص که سختی و استانداردش رو میدونن) همبستگی داره یا نه.
- دومین نکته: اگه بر اساس عمق فکر برنامهریزی کنیم، مدل بهتر یاد میگیره تا اینکه بیایم سرفصلها رو صرفاً بر اساس طول سوال یا نمرهای که داورها میدن بچینیم.
- سومی هم اینه که این سیستم با مدلهای مختلف معلمه (Teacher Model – همون مدلهایی که جواب درست رو به مدل اصلی یاد میدن) قابل اجراست و خیلی وابسته به یکی نیست، فقط کافیه یه کم فرمت جوابها رو رعایت کنیم.
برای اینکه قضیه خیلی علمی و باکلاس باشه، یه چارچوب مشخص برای ارزیابی پیشنهاد دادن تا بشه سنجید واقعاً این راهکار جواب میده یا نه. تازه مشکلات احتمالی رو هم در نظر گرفتن. مثلاً اینکه شاید مدل معلم سبک خاصی تو نوشتن جواب داره و این ویژگیش باعث بشه نتیجهها دقیق نباشه، یا اینکه گاهی طول جواب با عمق فکر قاطی میشه و باید حواسمون باشه اینا رو قاطی نکنیم!
در کل اگر بخوام خلاصه کنم: این کار میخواد آموزش مدلهای هوش مصنوعی رو یه ذره شبیه تربیت ذهن انسان بکنه، یعنی مدل رو مرحله به مرحله با سوالهای عمیقتر به چالش بکشه. اینطوری هم مدلهامون بهتر میشن و هم روند یادگیریشون قابل فهم و کنترلتر میشه؛ نه اینکه یه جعبه سیاه باشن که فقط قیافهشون شیکه!
راستی، این تیٔوری و روش رو میخوان تو دنیای مدلهای زبانی (LLM – Large Language Models یعنی مدلهای بزرگ زبانی) پیاده کنن تا موقع آموزش واقعاً قدم به قدم مثل ذهن انسان پیش بره و به سوالای استدلالی سخت جواب بده. خلاصه با این روش، هوش مصنوعیها قراره باهوشتر، قویتر و قابل فهمتر بشن!
منبع: +