SOLD: مدل باحال جدید برای ساخت دارو با کمک هوش مصنوعی و سلفی!

Fall Back

این چند وقت اخیر، هوش مصنوعی حسابی داره دنیای طراحی دارو رو تکون می‌ده! مخصوصاً تو بحث ساخت داروی جدید که از پایه واسه یه پروتئین خاص ساخته می‌شه؛ مثلاً وقتی دانشمندا می‌خوان مولکول‌هایی رو بسازن که به یه پروتئین خاص بچسبه و شاید بیماری رو درمان کنه.

معمولاً روش‌های قبلی توی این حوزه یه مشکلی داشتن: باید مولکول جدید رو تو فضای سه‌بعدی طراحی می‌کردن (یعنی هر اتم و ساختار شیمیایی رو به صورت سه‌بعدی مدل می‌کردن و این کلی زمان و دردسر داشت). تازه اونقدر فرآیندش پیچیده و کند بود که نمی‌شد با خیال راحت تعداد زیادی مولکول بسازی و چک کنی کدومش بهتر کار می‌کنه.

حالا اینجا یه مدل جدید به اسم SOLD معرفی شده که خلاصه‌ی اسمش هست SELFIES-based Objective-driven Latent Diffusion. بذار یه کوچولو توضیح بدم:

  • SELFIES یعنی یه مدل نوشتاری که ساختارهای شیمیایی رو به‌جای ساختار سه‌بعدی، با یه رشته‌ی متنی (تقریباً مثل یه جمله‌ی مخصوص مولکول‌ها) نشون می‌ده. اینطوری پردازش کامپیوتریش راحت‌تر و سریع‌تره!
  • Latent Diffusion Model هم یعنی مدلی از هوش مصنوعی که اطلاعات رو می‌بره تو یه فضای فشرده و غیرمستقیم (که بهش می‌گن فضای “latent”) و بعد مثل یه موج منظم، اطلاعات واقعی رو از اونجا بیرون می‌کشه. این روش معمولاً باعث میشه مدل‌ها هم سریع‌تر و هم انعطاف‌پذیرتر بشن.

توی SOLD، دیگه خبری از مدل کردن مولکول به صورت سه‌بعدی نیست؛ هر مولکول فقط با رشته‌ی SELFIES توی کامپیوتر نمایش داده می‌شه. بعد مدل هوش مصنوعی میاد تو این فضای (مثلاً) خلاصه شده، کلی مولکول جدید طرح می‌زنه که احتمالاً واسه اون پروتئین هدف جذاب باشن!

یه نکته‌ی باحال دیگه اینه که توی این کار، نویسنده‌ها یه ترنسفورمر جدید مخصوص SELFIES هم آموزش دادن. (ترنسفورمر یه مدل دیتاساینتسی خیلی قدرتمنده که تو زبان و تصویر عالی کار می‌کنه، اینجا برای مولکول‌ها استفاده شده!)

یه مشکل رایج توکارهای چندوظیفه‌ای این بوده که موقع آموزش هوش مصنوعی باید یاد بگیری چطور وزن هر کار یا مسئله رو تنظیم کنی که همه نتیجه‌ها خوب بشه. نویسنده‌ها یه روش جدید برای بالانس کردن ضرر (loss) پیدا کردن تا مدل توی همه وظیفه‌ها خوب کار کنه.

در نهایت نتیجه اینه که SOLD تونسته خیلی سریع و سرراست، مولکول‌هایی بسازه که چسبندگی (affinity) خیلی بالایی نسبت به پروتئین هدف دارن (یعنی احتمال قوی داره خوب جواب بدن). تازه چون مدل انعطاف‌پذیره و می‌تونه با دیتاهای بیشتر بهتر بشه، کلی پتانسیل رشد براش هست.

خلاصه داستان این تحقیق اینه: با یک مدل نو و تروتازه که به‌جای مغز گذاشتن توی پیچیدگی‌های سه‌بعدی، با استفاده از رشته‌های متنی SELFIES و هوش مصنوعی مدرن (لاتنت دیفیوژن)، مسیر ساخت دارو رو هم ساده‌تر، هم سریع‌تر و هم آینده‌دارتر کردن!

منبع: +