پروفیوژن: روش باحال بازسازی سه‌بعدی ساختار پروتئین‌ها با استفاده از عکسای AFM از چند زاویه

Fall Back

ببین بیا یه چیزی بهت بگم درباره داستان سخت بازسازی ساختار پروتئین‌ها، مخصوصاً وقتی چندتا پروتئین با هم کاری انجام میدن (که به این ترکیب میگن “پروتئین کمپلکس”). الان کلی هوش مصنوعی هست که کمک کرده بفهمیم پروتئین‌ها چه شکلی‌ان، اما وقتی پای چندتا پروتئین که با هم در تعاملن وسط میاد، هنوزم مدل‌ها مشکل دارن. دلیلش هم اینه که معمولاً یه سری داده سه‌بعدی دقیق از این کمپلکس‌ها رو نداریم که به الگوریتم بگیم: آقا! دقیقاً اینطوری کنار هم قرار گرفتن!

برای همین دانشمندها معمولاً میرن سراغ تکنیک‌های آزمایشگاهی دقیق مثل کریوالکترون میکروسکوپی (Cryo-EM) که خیلی با جزئیات کار می‌کنه، ولی این روش‌ها هم گرونن، هم کلی زمان می‌بره.

حالا بیام سر اصل مطلب: یه تیم باهوش اومده یه روش هیبرید جدید درست کرده به اسم “ProFusion” که خلاصه بگم، هوش مصنوعی رو با تصویربرداری با میکروسکوپ نیروی اتمی (AFM) مخلوط کرده. AFM یه جور میکروسکوپه که برخلاف بیشتر میکروسکوپ‌ها، به‌جای عکس گرفتن مثل دوربین، از سطح نمونه یه نقشه ارتفاعی خیلی دقیق می‌گیره. تازه، این کار رو با زاویه‌های تصادفی هم انجام می‌ده، یعنی عملاً اطلاعات چند‌زاویه‌ای (multi-view) به رایگان داره بهت می‌ده.

ولی یه مشکل بزرگ هست؛ گرفتن یه دیتاست بزرگ از این عکس‌های AFM واقعی که بتونی مدل هوش مصنوعی رو باهاش آموزش بدی، تقریباً محاله. نه زمانش جواب می‌ده، نه هزینه‌اش! واسه همین ایده جالبی داشتن: یه AFM مجازی ساختن (یعنی فرایند عکس گرفتن رو با کامپیوتر شبیه‌سازی کردن) و واسه چیزی حدود ۵۴۲ هزار تا پروتئین از زوایای مختلف عکس مصنوعی گرفتن. یعنی یه عالمه دیتا تولید کردن که می‌تونن باهاش مدلشون رو آموزش بدن.

حالا سراغ مدل اصلی بریم. اول با یه مدل «دیفیوژن شرطی» (conditional diffusion model – یه نوع مدل هوشمند که می‌تونه از یه ورودی، احتمالاً عکسایی که ژست خاصی ندارن، تصویرای جدید بسازه) کار می‌کنن تا زاویه‌های تازه‌ای بسازن. بعدش، با یه مدل Neural Radiance Field یا NeRF (که اگه بخوام ساده بگم یعنی مدلی که اجازه می‌ده ساختار سه‌بعدی رو از کلی دیدگاه مختلف reconstruct بکنی) میان کل ساختار سه‌بعدی پروتئین رو بازسازی می‌کنن.

نکته باحال اینه که کیفیت کاری که به‌دست میارن، واقعاً خوب درمیاد. اگر بدونی، برای اندازه‌گیری دقت این مدل‌ها از معیاری به اسم Chamfer Distance استفاده می‌کنن که خلاصه‌ش می‌شه: هر چی کمتر باشه، یعنی شکل بازسازی‌شده به نمونه واقعی نزدیک‌تره. نتیجه این تحقیق نشون داد خطای مدلشون تقریباً به کوچیکی کیفیت خود AFM اومده بود! یعنی هر چی AFM نشون می‌داد، مدل هم همونو دقیقاً بازسازی می‌کرد.

تازه به کمک همین شبیه‌سازی و مدل‌سازی سه‌بعدی با هوش مصنوعی، از AFM واقعی هم استفاده کردن و ساختار واقعی چند سرپروتئینی یا همون پروتئین کمپلکس‌ها رو هم بازتست کردن و دیدن خیلی جواب می‌ده. یعنی این روش هم سریع‌تره، هم ارزون‌تر، هم واسه تست و خطا واقعاً بدردبخوره؛ اونم بدون دردسرای روش‌های گرون و وقت‌گیر.

خلاصه اینکه ProFusion واقعاً مسیر جدیدی باز کرده برای پیش‌بینی دقیق و مطمئن ساختار کمپلکس پروتئینی با کمک مدل‌های باحال یادگیری عمیق، شبیه‌سازی کامپیوتری AFM و البته تست آزمایشگاهی. این یعنی یه قدم بزرگ برای بیوشیمی و زیست‌شناسی ساختاری!

منبع: +