خب، بذار خیلی راحت و خودمونی برات توضیح بدم. این روزا درمان بیماریهایی که سخت درمان میشن، با کمک سلولهای بنیادی مزانشیمی (که بهشون MSC هم میگن) به نتایج امیدبخشی رسیده. اما بزرگترین دردسر اینجاست که تولید این سلولها کلی دنگ و فنگ داره، چون باید کیفیتشون رو حتماً کنترل کنیم. یکی از معیارهای مهم هم اینه که ببینیم میزان پوشش یا همون کانفلوئنس سلولها (confluence یعنی اینکه چقدر سطح ظرف با سلولها پر شده) به اندازه کافی هست یا نه.
تا همین چند وقت پیش، واسه اینکه بفهمیم این کانفلوئنس چقدره، باید آدم مینشست و دونهبهدونه عکسهای میکروسکوپی رو میدید و آنالیز میکرد. اما خب الان با کمک یادگیری عمیق (deep learning یعنی الگوریتمهایی که با دادههای زیاد یاد میگیرن) میشه این کار رو خودکار کرد. فقط مشکل اینجاست که ساختن دیتاست مناسب و برچسب زدنش خیلی زمانبر و گرون درمیاد و راجبش خیلی تحقیق نشده.
حالا موضوع اصلی این مقاله اینه که بررسی کردن چطور میشه هوش مصنوعی رو با کمترین هزینه و زحمت واسه این کار به کار بگیریم. نویسندهها رفتن سراغ چند روش: یادگیری فعال (active learning یعنی اینکه مدل خودش مشخص میکنه کدوم نمونهها رو شما باید براش برچسب بزنی تا بهتر یاد بگیره)، برچسبگذاری هدفمحور (goal-dependent labeling یعنی فقط همون مواردی رو برچسب میزنیم که واقعاً برای هدفمون لازمه)، و استفاده از “مدلهای بنیادین” (foundation models یعنی مدلهایی بزرگ و هوشمند که واسه کلی کار مختلف، قبلاً آموزش دیدن و میشه راحت ازشون برای کارهای جدید استفاده کرد) که هیچ آموزش یا برچسبزنی خاصی نمیخوان. به این مدلها میگن “zero-shot” یعنی مدل بدون اینکه واسه این کار آموزش خاصی دیده باشه، آماده استفادهست!
حالا بیاید ببینیم نتیجه چی شد:
جالبترین چیزی که پیدا کردن این بود که با مدل Segment Anything Model یا همون SAM (SAM یک مدل خیلی بزرگ هست که میتونه بخشهای مختلف تصویر رو بدون آموزش خاص پیدا کنه)، شما میتونی بدون حتی یک خط آموزش اضافه یا برچسب زدن مخصوص همین کار، نتایج عالی بگیری! یعنی SAM توی تخمین کانفلوئنس حتی از مدلهایی که حسابی واسه همین کار آموزش و تنظیم شدن هم بهتر جواب داد! واقعاً بدون زحمت!
یه نکته دیگه اینکه یادگیری فعال که خیلیها فکر میکنن قرار خیلی بهتر جواب بده، توی این پروژه تفاوت خاصی با انتخاب تصادفی نمونهها واسه آموزش نداشت—مخصوصاً وقتی دادهها تقریبا مشابه و یکنواخت هستن (homogeneous dataset یعنی همه تصاویر خیلی بههم شبیهان). پس اگه فکر میکردی یادگیری فعال قراره کلی کمک کنه، اینجا اینطور نشد!
یه نکته جالب دیگه هم این بود که اگه برچسبگذاری رو فقط مخصوص هدف اصلیت انجام بدی (مثلاً فقط بخشهایی که برات مهمه رو برچسب بزنی)، همونقدر نتیجه خوب میگیری که اگر کل دیتاست رو با وسواس و سختی خیلی زیاد برچسب بزنی! یعنی وقت و انرژی زیادی تلف نمیشه و نتیجه هم تغییر محسوسی نداره.
خلاصه این پژوهش خیلی از باورهای غلط قبلی رو به چالش کشید: دیگه نه لازمِ کلی نمونه جورواجور جمع کنی و خفن برچسب بزنی، نه حسابی مدل رو ریز و دقیق تنظیم کنی! فقط کافیه مدلهای بنیادین مثل SAM رو به کار بگیری و مقداری برچسب هدفمحور بزنی.
در نهایت، این مطالعه راهحل عملی و کاربردی داده برای پیادهسازی کنترل کیفیت خودکار سلولهای بنیادی مزانشیمی در کارخونهها یا آزمایشگاهها: زیاد دنبال جمعآوری دیتاستهای حجیم و برچسبگذاری هاردکور نباش—با مدلهای هوشمند آماده خیلی راحتتر جواب میگیری و هزینهات هم خیلی کمتر میشه!
پس اگه تو دنیای تولید و کشت سلولهای بنیادی هستی و دوست داری کارهات هوشمندتر و ارزونتر بشه، این روشهای جدید و مدلهایی مثل SAM کلی کارت رو ساده میکنن. به قول معروف: گاهی راهحل آسونتر و کمخرجتر از اونیه که فکرش رو میکنی 😉
منبع: +