بذار یه چیز باحال رو واست تعریف کنم! یه تیم از محققها اومدن سراغ موضوعی که همیشه تو پزشکی کلی وقت و پول میبره: ساخت دیتابیس تصویری پزشکی، بخصوص تصاویر سونوگرافی از گرههای تیروئیدی (همون گرههای کوچیک داخل غده تیروئید). خب، برای اینکه این دیتابیس بدردبخور باشه، هر تصویر باید روش برچسب بخوره یعنی متخصص بیاد به صورت دستی بگه دقیقاً این قسمت چیه و چیکار میکنه. این کار خیلی وقتگیره و خستهکننده است.
حالا این تیم باهوش گفتن چرا از هوش مصنوعی استفاده نکنیم که خودش قبل از آدمها تصویرها رو برچسب بزنه؟! به این میگن pre-annotation. یعنی قبل اینکه متخصص آدم بیاد برچسب بزنه، مدل یادگیری ماشین یه دور خودش سعی میکنه بفهمه تصویر چیه و برچسب بزنه. اگه مدل خوب کار کنه، کلی از وقت آدمها ذخیره میشه. این مدلی که استفاده کردن اسمش YOLOv8 بوده. YOLO (You Only Look Once) یه مدل هوش مصنوعیه که برای شناسایی و پیدا کردن اشیا تو تصاویر استفاده میشه، مثلا خودش میتونه تو عکس بگه این گربهست یا اون یه ماشینه! ورژن هشتمش هم حسابی قوی و رونده.
واسه اینکه YOLOv8 بتونه تصاویر سونوگرافی رو بهتر بفهمه، اومدن علاوه بر روشهای عادی افزایش داده (Data Augmentation یعنی دستکاری تصاویر با چیزهایی مثل چرخش، برش، تغییر نور و …) مخصوص سونوگرافی هم پیاده کردن. این جوری مدل با انواع مختلف تصاویر آشنا میشه و میتونه بهتر یاد بگیره. مخصوصاً چون تعداد تصاویر تو هر کلاس گره تیروئیدی متعادل نبود و بعضیاش کمتر داشتن، این روش کلی کمک کرد که مدل گیج نشه و همه رو خوب یاد بگیره.
نتیجه؟ خیلی جالب شد! وقتی مدل رو با دادههای تحریفشده (همون augmented data) آموزش دادن، نتیجهش خیلی بهتر از موقعی شد که فقط تصاویر خام رو استفاده میکردن. اگه فقط ۱۳۶۰ تصویر “اصلی” داشتن (با ۷ نوع مختلف گره تیروئیدی که هر کدوم یه کلاس محسوب میشن)، اون مدل هوش مصنوعی که با دادههای تقویتشده آموزش دیده بود، میتونست حداقل ۳۰ درصد از کار برچسبزنی دستی رو برای پزشکای تازهکار کم کنه. یعنی یه پزشک مبتدی لازم نبود اونقدر تصویر رو یکی یکی دستی برچسب بزنه و مدل تا حد زیادی کار رو براش پیشزمینه میداد.
حالا اینو داشته باش: اگه تعداد تصاویر اصلی رو برسونن به ۶۸۰۰ تا، دقت مدل دیگه تقریباً همسطح پزشک مبتدی میشه! این یعنی کار به جایی میرسه که دیگه برای برچسبزنی اولیه نیاز به دخالت آدم نیست و مدل خودش پیشنویس رو میزنه، آدمها فقط واسه تأیید نهایی یا تصحیح احتمالی میان وسط.
جمعبندی کنم برات: این رویکرد مرحلهبهمرحله که مدام مدل روی سری جدید داده آموزش میگیره و از تواناییش برای پیشبرچسبزنی استفاده میکنیم، هم هزینه و هم وقت ساخت بانک دادههای تصویری پزشکی رو کلی کم میکنه. مخصوصاً جایی مثل سونوگرافی که دادههای دقیق و درست خیلی مهم و در عین حال پرزحمتن. در نتیجه، نه تنها دست پزشکها بازتر میشه واسه کارای تخصصیتر، بلکه هوش مصنوعی هم هر روز هوشمندتر و کاربردیتر میشه – یه برد-برد به تمام معنا!
منبع: +