این روزا بحث استفاده از هوش مصنوعی توی حوزه پزشکی حسابی داغه و کلی داره روند کارها رو تغییر میده. یکی از ایدههای خیلی باحال، استفاده از یه چیزی به اسم “عاملهای مولد” (Generative Agents یا همون GAs) هست که دارن وارد ماجرای مدارک بالینی و اسناد پزشکی میشن. اگر بخوایم خیلی ساده بگیم، عامل مولد یعنی یه مدل هوش مصنوعی که میتونه خودش اطلاعات یا داده بسازه، مخصوصاً از اون مدلهایی که خیلی باهوشن و بهشون میگن LLM یا Large Language Model، مثلاً همون ChatGPT خودمون!
حالا مشکل چیه؟ واقعیت اینه که دسترسی به پروندههای پزشکی الکترونیکی (EHRها) خیلی سخته چون کلی قوانین سفت و سخت و نگرانیهای اخلاقی و تکنیکی هست. مثلاً بحث حفظ حریم خصوصی بیمارا و اینکه کسی دادهها رو دزدکی نگاه نکنه. توی این شرایط، ایده «تولید داده سلامتی مصنوعی» یا همون SHDG اومده وسط. معنیاش اینه که هوش مصنوعی میاد و یه سری داده جعلی اما خیلی نزدیک به واقعیت میسازه، طوریکه کاملاً شبیه اطلاعات واقعی بیمارا باشه، ولی در اصل”ساختگی” هست و کسی رو لو نمیده!
اما این روش هم مشکلات خودش رو داره: اول اینکه ممکنه داده ساختگی گاهی اشتباه یا گمراهکننده باشه. یا مثلاً یه سری پیشداوری و تعصبهای ناخودآگاه (Bias) رو از دادههای آموزشیش یاد بگیره و تکرار کنه. بدترش اینه که معمولاً شفافیت ندارن و آدم نمیدونه هوش مصنوعی دقیقاً روی چه اساسی یه نتیجه باید بسازه یا تصمیم بگیره.
اینجا محققای مقاله اومدن یه راه حل خیلی باحال ارائه دادن: اونا یه روشی رو معرفی کردن که هم حریم خصوصی حفظ میشه، هم زبون و سبک نگارش مدارک پزشکی واقعی رعایت میشه، هم اطلاعات مفید و واقعی توش از بین نمیره. همه اینا با کمک چندتا عامل مولد تخصصی و نقشمحور اتفاق میفته؛ یعنی هر “عامل” یه نقش خاص (مثلاً دکتر یا پرستار یا مسئول فنی) رو بازی میکنه و تو تولید داده شریک میشه.
کل این فرآیند بدون کد نویسی پیچیده کار میکنه (No-Code یعنی نیاز نیست برنامهنویس باشی!) و روی یه زیرساخت چندلایه گذاشته شده که اسمش DSI Stack هست. این همون بستریه که نرمافزار و سختافزار توش هماهنگ میشن تا همه چیز سریع و امن پیش بره و حتی آدمایی که خیلی فنی نیستن هم بتونن راحت ازش استفاده کنن. مثلاً DSI Stack باعث میشه متخصصای سلامت راحتتر بتونن دادههای پزشکی ساختگی بسازن و مشکلی با امنیت یا کاربری نداشته باشن.
برای اینکه مطمئن بشن این روش واقعا جواب میده یا نه، اومدن یه چارچوب ارزیابی کامل برای SHDG درست کردن که با کمک تکنولوژی GenAI (یعنی هوش مصنوعی مولد!) به طور خودکار کیفیت دادههای ساختگی رو تحلیل و با دادههای واقعی مقایسه میکنه؛ تازه نه فقط تو یه سند، بلکه روی کلی مدرک مختلف با همدیگه. نتیجه چی شد؟ نشون داد که این روش خیلی شفاف و قابل تکراره و میتونه به تحقیقات پزشکی کمک کنه، سیستمهای سلامت هوشمند رو جلو ببره و حتی به نوآوریهای جدید برسونه.
یه نکته هم اینکه همه ابزارها، مدلها، دادههای ساختگی و حتی راهنماهاشون رو آزاد گذاشتن و هر کی خواست میتونه از گیتهاب این پروژه استفاده کنه: https://github.com/HR-DataLab-Healthcare/RESEARCHSUPPORT/tree/main/PROJECTS/GenerativeAgentbasedData-Synthesis
خلاصه اگر دنبال راهی هستی که دادههای پزشکی واقعگرا و شخصیسازی نشون بدی بدون اینکه امنیت اطلاعات کسی به خطر بیفته یا قانون رو دور بزنی، این روش عاملهای مولد حسابی میتونه کمکت کنه! تازه کلی باحال و آیندهداره.
منبع: +