خب بچهها، بیاین یه داستان خفن رو براتون تعریف کنم که توش ترکیبی از هوش مصنوعی، شبیهسازی و کمی جادوی ریاضی داریم! موضوع اینه: میخوایید فقط با کشیدن چندتا خط ساده یا همون اسکچ (یعنی نقاشی خیلی خلاصه و ساده)، یه صحنه دود خیلی واقعی و پیشرفته بسازید؟ این دقیقاً همون کاریه که تو این مقاله جدید بهش پرداختن.
کل قضیه اینجوریه که اول یه مدل دوتایی یا دوتا مرحلهای درست کردن. کار از اینجا شروع میشه که کاربر—یعنی خودِ شما—یه طرح اولیه و خیلی ساده میکشه. این طرح یا اسکچ میشه راهنما برای مرحله بعد: سیستم میاد با کمک یه چیزی به اسم «تابع جریان» یا Stream Function (یه مدل ریاضی که حرکت سیال و دود رو تو فضا توصیف میکنه و میتونه نشون بده دود کجاها میچرخونه و چهجوری حرکت میکنه)، روند حرکت کلی این دود رو درمیاره.
حالا چرا تابع جریان استفاده میکنن؟ چون طرحهای دستی معمولاً دیتاهای ریز و چرخشی یا همون اتفاقات داخلی دودهارو نشون نمیدن، ولی stream function دقیقاً این نقاط ضعف رو داره جبران میکنه و اطلاعات دقیقتر از کارهایی مثل چرخش و پیوستگی حرکت رو درمیاره. مثلاً فرض کن یه دود داری که توش پیچوتاب خورده، این اطلاعات با اسکچ ساده قابل نمایش نیست، ولی این تابع جریان میتونه همه این پیچوتابها رو برای مدل شبیهسازی کاملاً توضیح بده.
بعد وارد بخش بِحالترش میشیم: تو این فریمورک (یعنی مجموعهای از الگوریتمها و مدلها که باهم کار میکنن)، اون تابع جریان میشه ورودی برای یه مدل پیشرفتهتر که اسمش لاتینش Latent Diffusion Model یا LDM ـه (این یه جور مدل هوش مصنوعیه که مخصوص تولید تصویر واقعیه و تو سالهای اخیر حسابی معروف شده، مثلاً Midjourney یا Stable Diffusion رو شنیدین؟ اونا هم از همین رویکردا استفاده میکنن). LDM میاد بر اساس اون تابع جریان و خطخطی اولیه شما، دود واقعی و متحرک میسازه.
برای اینکه مدل کاملاً حرکات کلی دود رو درک کنه، چی کار میکنن؟ میان تو آموزش مدل، از “streamlines” استفاده میکنن. این streamlines یعنی خطوطی که مسیر حرکت کلی مایع یا گاز رو نشون میدن—مثلاً انگار مسیر جریان آب رودخونه رو با خط کشیدی! اینطوری مدل نه تنها حرکت جزئی، بلکه حرکت کلی کوه دود رو هم میفهمه.
در نهایت، این سیستم دوتایی طوری کار میکنه که هم خلاقیت و سلیقه کاربر حفظ میشه (چون کاربر خودشه که اسکچ رو طراحی میکنه)، هم نتیجه نهایی شبیه به یه دود واقعی با حرکت دلخواه درمیاد—نه یه دود الکی نقاشیشده!
خلاصه اینکه اگه همیشه دوست داشتی خطخطیهات رو به صحنههای واقعگرایانه دود تبدیل کنی و فکر میکردی هوش مصنوعی هنوز اینقدرها خفن نشده، حالا دیگه بدون شدنیه! فقط کافیه یه مدل «دو مرحلهای تولید دود با خطخطی و تابع جریان» رو تست کنی!
منبع: +