خب رفقا، امروز میخوام براتون درباره یه پروژه باحال و تازهوارد تو دنیای هوش مصنوعی و شبیهسازی سیالات حرف بزنم. قضیه اینه که تا الان مدلهای زبانی بزرگ – همونهایی که میتونن باهاتون چت کنن یا براتون متن تولید کنن، مثل ChatGPT – بیشتر تو زمینه کارای زبون و متنی معروف بودن. مثلاً تو خلاصه کردن متن، جواب دادن به سوالای عمومی یا حتی نوشتن کد برنامهنویسی. البته! ولی خب یه چیزی هنوز خیلی کم بود: اینکه این هوشهای مصنوعی چجوری میتونن تو کارای تخصصیتر و فنیتر وارد شن؟
CFD چیه اصلاً؟
بیاین یه توضیح دوستانه بدم: CFD یعنی Computational Fluid Dynamics یا همون مهندسی مکانیک سیالات با استفاده از شبیهسازی عددی. یعنی با کامپیوتر بررسی میکنن سیالات (مثل آب و هوا) چطور حرکت میکنن و چطور نیروها توشون اثر میذارن. مثلاً برای طراحی ماشین، هواپیما یا سد، لازمه بدونن جریان سیالات چطوریه. خود این کار واقعاً پیچیده و وقتگیره و معمولاً باید کلی عدد و معادلات رو با برنامهنویسی حل کرد.
هوش مصنوعی وارد ماجرا میشه…
حالا محققای باحال اومدن یه سری تست و ارزیابی جدید ساختن تا ببینن واقعاً این مدلهای زبانی قوی مثل ChatGPT اگه بیان سراغ کارای سیالاتی، چی کار از دستشون برمیاد! اسم این پروژه شده CFDLLMBench. به زبون ساده، یه مجموعه بزرگ تست و ارزیابیه که مدلهای هوش مصنوعی رو تو شبیهسازی سیالات محک میزنه ببینه چقدر بلدن و تا کجا میتونن کمک کنن.
CFDLLMBench از چه بخشایی تشکیل شده؟
این مجموعه سه بخش داره (و هر کدوم هم یه اسم خفن دارن):
۱. CFDQuery: این یه جور تست سوالات مفهومی در سطح ارشد یا دکترا از خود CFDه. یعنی سوالای تخصصی که ببینن مدل واقعاً اصول سیالات رو میدونه یا نه!
۲. CFDCodeBench: این قسمت، مدل هوش مصنوعی باید کدنویسی کنه! باید برنامههایی بنویسه که مسائل واقعی CFD رو حل کنه. یعنی فقط حرف زدن کافی نیست، باید کد هم بزنه و جواب بگیره.
۳. FoamBench: این دیگه قسمت حرفهای ماجراست. باید مدل، کل گردشکار شبیهسازی رو، بسته به شرایط مختلف، پیاده کنه. یعنی مثلاً بفهمه کی چه دیتایی لازمه، کجا باید کد بزنه، کی پارامترها رو عوض کنه… خلاصه همون چیزایی که مهندسای شبیهسازی تو دنیای واقعی انجام میدن!
چه چیز خاصی CFDLLMBench رو مهم میکنه؟
اول اینکه پایه و اساس تستها کاملاً واقعیه. یعنی سوالا و پروژهها از دل کار روزمره مهندسای CFD دراومده. دوم، فقط به جواب دادن کافی ندارن، بلکه دقت اجرا، درستی حل عددی و حتی اینکه راهحلها چقدر به جواب درست نزدیک میشن رو هم ارزیابی میکنن.
خلاصه، این مجموعه کمک میکنه بفهمیم مدلهای زبانی تو پروژههای فنی و پیچیده چقدر واقعا مفیدن یا باید هنوز دست نگه داریم.
اگه دوست داری بیشتر بدونی…
کدها و دیتاهاشون هم آزاد گذاشتن (Open Source یعنی هرکی دوست داره دانلود و تستش کنه!) تو گیتهاب گذاشتن: https://github.com/NREL-Theseus/cfdllmbench/
بعید نیست که تو آینده همین مدلهای زبان قوی بتونن کلی از پروژههای مهندسی رو اتوماتیک کنن و واقعاً جای دست یار سیالات بشینن پشت لپتاپ! این پروژه هم پایه محک قوی واسه اون داستانا میذاره. دنیای هوش مصنوعی داره هی هیجانانگیزتر میشه…
منبع: +