خب بچهها، قراره براتون در مورد یه پروژه خیلی باحال و خفن به اسم “FeynTune” حرف بزنم که مخصوص طرفدارهای فیزیک انرژیهای بالا (High-Energy Physics) هست. حالا این یعنی چی؟ فیزیک انرژیهای بالا همون زمینهایه که دانشمندها با ذرهها و چیزای ریز ریز و عجیب سروکار دارن، مثل همونایی که تو شتابدهندههای بزرگ کار میکنن.
حالا تیمی که این پروژه رو راه انداختن، اومدن از مدلهای زبانی هوشمند استفاده کردن؛ اونم نه هر مدلی، بلکه بیست تا ورژن مختلف از یه مدل خیلی معروف به اسم Llama-3.1 رو فاینتیون (Fine-tune) کردن. فاینتیون یعنی مدل هوش مصنوعی رو یه جوری دوباره آموزش میدن تا برای یه کار خاص بهتر و دقیقتر باشه. اونم با ۸ میلیارد پارامتر! باور کن عدد کمی نیست، واقعاً غول تکنولوژی هست.
حالا هرکدوم از این بیست مدل، با ترکیبهای متفاوتی از خلاصهمقالات (Abstractها) سایت arXiv که مخصوص زمینههای فیزیک نظری (hep-th)، فیزیک ذرات (hep-ph) و گرانش کوانتومی (gr-qc) بودن، آموزش داده شدن. arXiv یه سایت خیلی معروفه که دانشمندها تقریباً همه مقالاتشون رو اونجا میذارن. این یعنی مدلها کلی اطلاعات دستهاول و تخصصی رو قورت دادن!
جالبتر اینکه، فقط به فیزیک اکتفا نکردن! اومدن برای مقایسه، به دیتاهای بیربطتر هم سر زدن؛ مثلاً دستهبندی q-bio (زیستشناسی کمی) یا cs (علومی مثل کامپیوتر یا هوش مصنوعی). اینکار رو کردن تا ببینن آموزش مدل با دادههای تخصصی چه تاثیری داره.
برای آموزش مدلها هم سراغ یه تکنیک بنام Low-Rank Adaptation رفتن. یعنی مدل رو با استفاده از یه روش سبکتر و سریعتر، روی دادههای جدید شخصیسازی کردن. اینطوری کلی در وقت و انرژی صرفهجویی میشه.
نتیجه چی شد؟ این مدلهای فاینتیونشده تونستن تو تسکهای خاص مثل کامل کردن خلاصهمقالات در زمینه hep-th حسابی بهتر از مدل اولیه (یعنی همون نسخه خام Llama-3.1) عمل کنن. به قول امروزیها، ترکوندن!
تازه برای اینکه قضیه واقعا جدی باشه، اینا مدلهاشون رو با کلهگندههای تجاری مثل ChatGPT (چتجیپیتی)، Claude، Gemini و DeepSeek هم مقایسه کردن. معلوم شد وقتی مدل رو دقیق رو زمینهای آموزش بدی، میتونه حتی از این غولهای بازار هم در وظایف خاص خودش بهتر باشه.
در آخر هم این تیم با این تحقیقات نشون دادن که مدلهای زبانی تخصصی میشه آینده تحقیقات فیزیک نظری رو متحول کنه و نکات جالبی برای ساخت مدلهای دقیقتر بعدی به دست آوردن.
خلاصه که اگه دنبال آینده هوش مصنوعی تو «فیزیک انرژیهای بالا» هستین یا یه کم کنجکاوین مدلهای زبانی چطور میتونن دانش رو پیش ببرن، پروژه FeynTune واقعاً براتون جذابه. هم کلی کار جدید کرده، هم جزئیات فنی پیشرفتهای داره، هم نشون داده تخصصی کار کردن چقدر میتونه جواب بده.
منبع: +