خب بچهها بیاین امروز یه موضوع باحال رو باهم باز کنیم! میخوایم ببینیم چجوری میشه مسیرهایی که آدمها توی شهر طی میکنن رو با کمک هوش مصنوعی به صورت واقعگرایانه و البته امن و خصوصی شبیهسازی کرد. همون دادههایی که مثلاً میتونه نشون بده مردم از کدوم خیابونها رد میشن و به کدوم جاها بیشتر سفر میکنن. این دادهها برای شهرهای هوشمند خیلی مهمه و به اقتصاد و مدیریت شهر حسابی کمک میکنه.
حالا مشکل چیه؟ مشکل اینه که جمعآوری این دادهها کلی هزینه داره و خب چون پای حریم خصوصی وسطه، نمیتونن خیلی راحت این اطلاعات رو عمومی کنن. واسه همین، یه راهکار باحال مطرح شده به اسم «Trajectory Synthesizing» که یعنی ساختن مسیرهای فرضی آدمها، بدون اینکه واقعاً اطلاعات شخصی کسی لو بره.
ولی تا الان مدلهایی که ساخته شده بودن، یه جورایی نقطهضعف دارن؛ یعنی نمیتونن اون پیچیدگی عجیب و غریب این مسیرها رو درست شبیهسازی کنن یا جزئیات دقیق رو درنیارن. مخصوصاً تو شهرهای شلوغ که مسیرها خیلی متنوع و پیچیدهس، این مدلها کم میارن.
اما اینبار توی مقالهای که اومده توی arXiv (که یه جور کتابخونه آنلاین برای مقالههای علمی توی حوزه کامپیوتر و ریاضیه)، یه مدل باحال معرفی شده به اسم Cardiff! Cardiff یه جور «چارچوب ترکیبی مبتنی بر دیفیوژن سلسلهمراتبی» هست. اگر این جمله براتون گیجکنندهس، نگران نباشین، الان دونه دونه بازش میکنم!
اول از همه، Cascaded Hybrid Diffusion یعنی چی؟ اینکه چند تا مدل با روش دیفیوژن (Diffusion) به صورت لایهبهلایه و مرحلهبهمرحله وصل شدن. خود Diffusion هم روشی توی هوش مصنوعی و یادگیری عمیقه (Deep Learning) که با اضافه کردن و بعد پاک کردن نویز به دادهها، یه جور تولید داده واقعگرایانه درست میکنه. مثلاً بهش دادههای واقعی میدی، توشون نویز قاطی میکنه، بعد یاد میگیره چجوری نویز رو حذف کنه و برعکسش رو بلد میشه انجام بده!
حالا Cardiff چیکار میکنه؟ اومده از معماری دو مرحلهای استفاده کرده:
-
اول مرحله درشت و کلی: اینجا مسیر رو در سطح «قطعههای خیابون» یا Road Segmentها تولید میکنن. یعنی اصلاً کاری نداریم دقیقاً توی کدوم نقطه جغرافیایی هستیم؛ فقط اینکه از کدوم خیابون رد میشیم مهمه. برای این کار، مسیرها رو به صورت یه چیز خیلی جمع و جور (بهش میگن latent embeddings – یعنی تبدیلشون میکنیم به یه سری بردار عددی با ابعاد پایینتر) نمایش میدن. بعد با استفاده از یه مدل ترکیبی (واسه اهل فن: Transformer-based Latent Denoising Network)، نویزها رو حذف میکنن و یه مسیر کلی و استاندارد درست میکنن.
-
مرحله بعد، دقیق و ظریف: توی مرحله دوم، سراغ اطلاعات «دقیق GPS» میرن. یعنی حالا که مسیر خیابونی کلی رو داریم، مشخص میکنیم دقیقاً توی کدوم نقطه جغرافیایی بودن. تو این مرحله هم باز یه مدل نویزگیر (Denoising Network) داریم که این بار با اضافهکردن یه کمکی به اسم Noise Augmentation (که یعنی به دادهها نویز اضافی میزنیم تا مدل قویتر و طبیعیتر بشه)، مسیرهای دقیق رو میسازه.
یه نکته خیلی جالب توی این روش اینه که چون مرحلهبهمرحله نویزها رو کم و زیاد و مدیریت میکنن، میتونیم تنظیم کنیم چقدر نتیجهمون روی «حفظ حریم خصوصی» تمرکز داشته باشه و چقدر روی «کاربردی بودن دادهها». یعنی انگار یه درجه داریم که هر وقت بخوایم خصوصیتر باشه، اون طرفتر میبریمش!
تیم Cardiff روی سه مجموعهداده واقعی و بزرگ از مسیرهای شهری امتحانش کردن و نتیجهش این شده که تو همه معیارها (metrics – یعنی اون شاخصهایی که باشون مدلها رو مقایسه میکنن) از مدلهای رقیب بهتر جواب داده. یعنی هم دقت مسیرهاش بالاس، هم شباهت به واقعیت داره، هم دیگه کسی نمیتونه ببینه این مسیر مال کی بوده!
در کل، اگه خلاصه بخوام بگم؛ مدل Cardiff اومده مسیرهای آدمها تو شهر رو هم خصوصی، هم دقیق و هم واقعگرایانه شبیهسازی میکنه. هم برای حریم خصوصی خوبه، هم برای کاربردهای باحال شهر هوشمند. و تازه میشه تنظیمش کرد که هر وقت دادهی خصوصیتر یا دقیقتر خواستیم، اونجوری تولید کنه. انصافاً ایده خیلی شات زده و باحاله!
اگه به هوش مصنوعی و دادههای شهری علاقه دارین، احتمال زیاد Cardiff رو طی ماههای آینده بیشتر خواهید شنید چون حسابی داره موضوع رو جذاب و کاربردی پیش میبره.
منبع: +