خب بچهها، بذارین خیلی خودمونی بگم جریان چیه! پیدا کردن یه دستور ساخت درست و حسابی برای مواد جدید همیشه یه چالش اساسی تو دنیای علم مواده. یعنی هرکی دنبال کشف مواد جدیده، باید کلی مقاله رو شخم بزنه، چون اطلاعات تو این مقالهها پخش و پلا و بعضاً گنگ هستن.
توی این مقاله، یه تیم اومده یه جعبهابزار درست کرده به اسم LeMat-Synth (همون لیمتسینث خودمون!). این سیستم میتونه با هوش مصنوعیهایی که هم زبان رو میفهمن و هم شکل و تصویر رو (که بهشون میگن LLM و VLM و این چیزا)، دونه به دونه اطلاعات مربوط به مراحل ساخت مواد و دادههای عملکردشون رو از دل مقالههای علمی جمع کنه و منظم بچینه مطمئناً LLM یعنی Large Language Model، یعنی مدل هوش مصنوعیای که کلی متن و زبان بلده؛ VLM هم Vision Language Model یعنی مدلی که هم از رو متن و هم از رو تصویر میتونه بفهمه داستان چیه.
تیم سازنده، اومدن ۸۱ هزار تا مقاله علمی آزاد رو ریختن تو این سیستم و یه دیتاست درست کردن به اسم LeMat-Synth 1.0 که توش دستورهای ساخت موادِ مختلف، با ۳۵ روش مختلف و ۱۶ طبقه مواد ریخته شده. همه اینا رو با یه نظامنامه مخصوص علم مواد (اون چیزی که حرفهایها بهش میگن «ontology»، یعنی یه جور ساختاردهی و دستهبندی دقیق برای علم مواد) مرتب کردن.
حالا فقطم دیتاست رو بیرون ندادن؛ بلکه کیفیت اطلاعات استخراجی رو هم حسابی بررسی کردن! اومدن یه تیکه از دیتاست رو (حدود ۲۵۰۰ تا دستور ساخت) دادن به کارشناسای خبره تا نظر بدن و همزمان با یه روش هوش مصنوعی خفن که میگن LLM-as-a-judge (یعنی یه مدل بزرگ زبانی خودش قضاوت کنه که داده درسته یا نه)، مطمئن شدن همه چی دقیق و قابل اعتماده.
جالبه بدونین این جعبهابزار فقط برای همین دیتاست ساخته نشده! کدش هم باز (open-source) گذاشتن که بقیه بچههای جامعه علمی بتونن بهش چیزای جدید اضافه کنن یا حتی روی دسته مقالههای دیگه هم امتحانش کنن.
در کل این حرکت قراره علم مواد رو یه قدم بزرگ جلو ببره؛ چون الان بجای اینکه محققها ساعتها دنبال یه دستور ساخت تو متن مقالهها بگردن، میتونن با یه دیتاست منظم و قابل جستجو همه اطلاعات رو دم دست داشته باشن. حتی قراره این دیتاها بعداً به پیشبینی روشهای ساخت جدید و ارتباط دادن ساختار ماده و خواصش کمک کنه. یعنی دیگه مراحل ساخت ماده رو میدیم به هوش مصنوعی، خودش پیشبینی میکنه چی میشه و چی باید بسازیم!
خلاصه اگه تو کار مواد و ساختشون هستی و یا حتی فقط عاشق هوش مصنوعی دوستداشتنی، این پروژه یکی از اون کارای فوقالعادهست که باید حتماً بهش یه نگاه بندازی!
منبع: +