CFDLLMBench: بالاخره مدل‌های زبانی هم وارد دنیای شبیه‌سازی سیالات شدن!

خب رفقا، امروز می‌خوام براتون درباره یه پروژه باحال و تازه‌وارد تو دنیای هوش مصنوعی و شبیه‌سازی سیالات حرف بزنم. قضیه اینه که تا الان مدل‌های زبانی بزرگ – همون‌هایی که می‌تونن باهاتون چت کنن یا براتون متن تولید کنن، مثل ChatGPT – بیشتر تو زمینه کارای زبون و متنی معروف بودن. مثلاً تو خلاصه کردن متن، جواب دادن به سوالای عمومی یا حتی نوشتن کد برنامه‌نویسی. البته! ولی خب یه چیزی هنوز خیلی کم بود: اینکه این هوش‌های مصنوعی چجوری می‌تونن تو کارای تخصصی‌تر و فنی‌تر وارد شن؟

CFD چیه اصلاً؟

بیاین یه توضیح دوستانه بدم: CFD یعنی Computational Fluid Dynamics یا همون مهندسی مکانیک سیالات با استفاده از شبیه‌سازی عددی. یعنی با کامپیوتر بررسی می‌کنن سیالات (مثل آب و هوا) چطور حرکت می‌کنن و چطور نیروها توشون اثر می‌ذارن. مثلاً برای طراحی ماشین، هواپیما یا سد، لازمه بدونن جریان سیالات چطوریه. خود این کار واقعاً پیچیده و وقت‌گیره و معمولاً باید کلی عدد و معادلات رو با برنامه‌نویسی حل کرد.

هوش مصنوعی وارد ماجرا میشه…

حالا محققای باحال اومدن یه سری تست و ارزیابی جدید ساختن تا ببینن واقعاً این مدل‌های زبانی قوی مثل ChatGPT اگه بیان سراغ کارای سیالاتی، چی کار از دستشون برمیاد! اسم این پروژه شده CFDLLMBench. به زبون ساده، یه مجموعه بزرگ تست و ارزیابیه که مدل‌های هوش مصنوعی رو تو شبیه‌سازی سیالات محک می‌زنه ببینه چقدر بلدن و تا کجا می‌تونن کمک کنن.

CFDLLMBench از چه بخشایی تشکیل شده؟

این مجموعه سه بخش داره (و هر کدوم هم یه اسم خفن دارن):

۱. CFDQuery: این یه جور تست سوالات مفهومی در سطح ارشد یا دکترا از خود CFDه. یعنی سوالای تخصصی که ببینن مدل واقعاً اصول سیالات رو می‌دونه یا نه!

۲. CFDCodeBench: این قسمت، مدل هوش مصنوعی باید کدنویسی کنه! باید برنامه‌هایی بنویسه که مسائل واقعی CFD رو حل کنه. یعنی فقط حرف زدن کافی نیست، باید کد هم بزنه و جواب بگیره.

۳. FoamBench: این دیگه قسمت حرفه‌ای ماجراست. باید مدل، کل گردش‌کار شبیه‌سازی رو، بسته به شرایط مختلف، پیاده کنه. یعنی مثلاً بفهمه کی چه دیتایی لازمه، کجا باید کد بزنه، کی پارامترها رو عوض کنه… خلاصه همون چیزایی که مهندسای شبیه‌سازی تو دنیای واقعی انجام می‌دن!

چه چیز خاصی CFDLLMBench رو مهم می‌کنه؟

اول اینکه پایه و اساس تست‌ها کاملاً واقعیه. یعنی سوالا و پروژه‌ها از دل کار روزمره مهندسای CFD دراومده. دوم، فقط به جواب دادن کافی ندارن، بلکه دقت اجرا، درستی حل عددی و حتی اینکه راه‌حل‌ها چقدر به جواب درست نزدیک میشن رو هم ارزیابی می‌کنن.

خلاصه، این مجموعه کمک می‌کنه بفهمیم مدل‌های زبانی تو پروژه‌های فنی و پیچیده چقدر واقعا مفیدن یا باید هنوز دست نگه داریم.

اگه دوست داری بیشتر بدونی…

کدها و دیتاهاشون هم آزاد گذاشتن (Open Source یعنی هرکی دوست داره دانلود و تستش کنه!) تو گیت‌هاب گذاشتن: https://github.com/NREL-Theseus/cfdllmbench/

بعید نیست که تو آینده همین مدل‌های زبان قوی بتونن کلی از پروژه‌های مهندسی رو اتوماتیک کنن و واقعاً جای دست یار سیالات بشینن پشت لپ‌تاپ! این پروژه هم پایه محک قوی واسه اون داستانا می‌ذاره. دنیای هوش مصنوعی داره هی هیجان‌انگیزتر می‌شه…

منبع: +