صرفه‌جویی حسابی تو هزینه‌های برچسب‌زنی تصاویر پزشکی با هوش مصنوعی قدم‌به‌قدم!

بذار یه چیز باحال رو واست تعریف کنم! یه تیم از محقق‌ها اومدن سراغ موضوعی که همیشه تو پزشکی کلی وقت و پول می‌بره: ساخت دیتابیس تصویری پزشکی، بخصوص تصاویر سونوگرافی از گره‌های تیروئیدی (همون گره‌های کوچیک داخل غده تیروئید). خب، برای اینکه این دیتابیس بدردبخور باشه، هر تصویر باید رو‌ش برچسب بخوره یعنی متخصص بیاد به صورت دستی بگه دقیقاً این قسمت چیه و چیکار می‌کنه. این کار خیلی وقت‌گیره و خسته‌کننده است.

حالا این تیم باهوش گفتن چرا از هوش مصنوعی استفاده نکنیم که خودش قبل از آدم‌ها تصویرها رو برچسب بزنه؟! به این می‌گن pre-annotation. یعنی قبل اینکه متخصص آدم بیاد برچسب بزنه، مدل یادگیری ماشین یه دور خودش سعی می‌کنه بفهمه تصویر چیه و برچسب بزنه. اگه مدل خوب کار کنه، کلی از وقت آدم‌ها ذخیره میشه. این مدلی که استفاده کردن اسمش YOLOv8 بوده. YOLO (You Only Look Once) یه مدل هوش مصنوعیه که برای شناسایی و پیدا کردن اشیا تو تصاویر استفاده میشه، مثلا خودش می‌تونه تو عکس بگه این گربه‌ست یا اون یه ماشینه! ورژن هشتمش هم حسابی قوی و رونده.

واسه اینکه YOLOv8 بتونه تصاویر سونوگرافی رو بهتر بفهمه، اومدن علاوه بر روش‌های عادی افزایش داده (Data Augmentation یعنی دستکاری تصاویر با چیزهایی مثل چرخش، برش، تغییر نور و …) مخصوص سونوگرافی هم پیاده کردن. این جوری مدل با انواع مختلف تصاویر آشنا میشه و می‌تونه بهتر یاد بگیره. مخصوصاً چون تعداد تصاویر تو هر کلاس گره تیروئیدی متعادل نبود و بعضیاش کمتر داشتن، این روش کلی کمک کرد که مدل گیج نشه و همه رو خوب یاد بگیره.

نتیجه؟ خیلی جالب شد! وقتی مدل رو با داده‌های تحریف‌شده (همون augmented data) آموزش دادن، نتیجه‌ش خیلی بهتر از موقعی شد که فقط تصاویر خام رو استفاده می‌کردن. اگه فقط ۱۳۶۰ تصویر “اصلی” داشتن (با ۷ نوع مختلف گره تیروئیدی که هر کدوم یه کلاس محسوب میشن)، اون مدل هوش مصنوعی که با داده‌های تقویتشده آموزش دیده بود، می‌تونست حداقل ۳۰ درصد از کار برچسب‌زنی دستی رو برای پزشکای تازه‌کار کم کنه. یعنی یه پزشک مبتدی لازم نبود اونقدر تصویر رو یکی یکی دستی برچسب بزنه و مدل تا حد زیادی کار رو براش پیش‌زمینه می‌داد.

حالا اینو داشته باش: اگه تعداد تصاویر اصلی رو برسونن به ۶۸۰۰ تا، دقت مدل دیگه تقریباً هم‌سطح پزشک مبتدی میشه! این یعنی کار به جایی می‌رسه که دیگه برای برچسب‌زنی اولیه نیاز به دخالت آدم نیست و مدل خودش پیش‌نویس رو می‌زنه، آدم‌ها فقط واسه تأیید نهایی یا تصحیح احتمالی میان وسط.

جمع‌بندی کنم برات: این رویکرد مرحله‌به‌مرحله که مدام مدل روی سری جدید داده آموزش می‌گیره و از توانایی‌ش برای پیش‌برچسب‌زنی استفاده می‌کنیم، هم هزینه و هم وقت ساخت بانک داده‌های تصویری پزشکی رو کلی کم می‌کنه. مخصوصاً جایی مثل سونوگرافی که داده‌های دقیق و درست خیلی مهم و در عین حال پرزحمتن. در نتیجه، نه تنها دست پزشک‌ها بازتر میشه واسه کارای تخصصی‌تر، بلکه هوش مصنوعی هم هر روز هوشمندتر و کاربردی‌تر میشه – یه برد-برد به تمام معنا!

منبع: +