چطور با مدل Cardiff راحت و امن مسیر آدم‌ها رو توی شهر شبیه‌سازی کنیم؟

Fall Back

خب بچه‌ها بیاین امروز یه موضوع باحال رو باهم باز کنیم! می‌خوایم ببینیم چجوری میشه مسیرهایی که آدم‌ها توی شهر طی می‌کنن رو با کمک هوش مصنوعی به صورت واقع‌گرایانه و البته امن و خصوصی شبیه‌سازی کرد. همون داده‌هایی که مثلاً می‌تونه نشون بده مردم از کدوم خیابون‌ها رد می‌شن و به کدوم جاها بیشتر سفر می‌کنن. این داده‌ها برای شهرهای هوشمند خیلی مهمه و به اقتصاد و مدیریت شهر حسابی کمک می‌کنه.

حالا مشکل چیه؟ مشکل اینه که جمع‌آوری این داده‌ها کلی هزینه داره و خب چون پای حریم خصوصی وسطه، نمی‌تونن خیلی راحت این اطلاعات رو عمومی کنن. واسه همین، یه راهکار باحال مطرح شده به اسم «Trajectory Synthesizing» که یعنی ساختن مسیرهای فرضی آدم‌ها، بدون اینکه واقعاً اطلاعات شخصی کسی لو بره.

ولی تا الان مدل‌هایی که ساخته شده بودن، یه جورایی نقطه‌ضعف دارن؛ یعنی نمی‌تونن اون پیچیدگی عجیب و غریب این مسیرها رو درست شبیه‌سازی کنن یا جزئیات دقیق رو درنیارن. مخصوصاً تو شهرهای شلوغ که مسیرها خیلی متنوع و پیچیده‌س، این مدل‌ها کم میارن.

اما این‌بار توی مقاله‌ای که اومده توی arXiv (که یه جور کتابخونه آنلاین برای مقاله‌های علمی توی حوزه کامپیوتر و ریاضیه)، یه مدل باحال معرفی شده به اسم Cardiff! Cardiff یه جور «چارچوب ترکیبی مبتنی بر دیفیوژن سلسله‌مراتبی» هست. اگر این جمله براتون گیج‌کننده‌س، نگران نباشین، الان دونه دونه بازش می‌کنم!

اول از همه، Cascaded Hybrid Diffusion یعنی چی؟ اینکه چند تا مدل با روش دیفیوژن (Diffusion) به صورت لایه‌به‌لایه و مرحله‌به‌مرحله وصل شدن. خود Diffusion هم روشی توی هوش مصنوعی و یادگیری عمیقه (Deep Learning) که با اضافه کردن و بعد پاک کردن نویز به داده‌ها، یه جور تولید داده واقع‌گرایانه درست می‌کنه. مثلاً بهش داده‌های واقعی می‌دی، توشون نویز قاطی می‌کنه، بعد یاد می‌گیره چجوری نویز رو حذف کنه و برعکسش رو بلد میشه انجام بده!

حالا Cardiff چیکار می‌کنه؟ اومده از معماری دو مرحله‌ای استفاده کرده:

  1. اول مرحله درشت و کلی: اینجا مسیر رو در سطح «قطعه‌های خیابون» یا Road Segmentها تولید می‌کنن. یعنی اصلاً کاری نداریم دقیقاً توی کدوم نقطه جغرافیایی هستیم؛ فقط اینکه از کدوم خیابون رد می‌شیم مهمه. برای این کار، مسیرها رو به صورت یه چیز خیلی جمع و جور (بهش میگن latent embeddings – یعنی تبدیلشون می‌کنیم به یه سری بردار عددی با ابعاد پایین‌تر) نمایش می‌دن. بعد با استفاده از یه مدل ترکیبی (واسه اهل فن: Transformer-based Latent Denoising Network)، نویزها رو حذف می‌کنن و یه مسیر کلی و استاندارد درست می‌کنن.

  2. مرحله بعد، دقیق و ظریف: توی مرحله دوم، سراغ اطلاعات «دقیق GPS» می‌رن. یعنی حالا که مسیر خیابونی کلی رو داریم، مشخص می‌کنیم دقیقاً توی کدوم نقطه جغرافیایی بودن. تو این مرحله هم باز یه مدل نویزگیر (Denoising Network) داریم که این بار با اضافه‌کردن یه کمکی به اسم Noise Augmentation (که یعنی به داده‌ها نویز اضافی می‌زنیم تا مدل قوی‌تر و طبیعی‌تر بشه)، مسیرهای دقیق رو می‌سازه.

یه نکته خیلی جالب توی این روش اینه که چون مرحله‌به‌مرحله نویزها رو کم و زیاد و مدیریت می‌کنن، می‌تونیم تنظیم کنیم چقدر نتیجه‌مون روی «حفظ حریم خصوصی» تمرکز داشته باشه و چقدر روی «کاربردی بودن داده‌ها». یعنی انگار یه درجه داریم که هر وقت بخوایم خصوصی‌تر باشه، اون طرف‌تر می‌بریمش!

تیم Cardiff روی سه مجموعه‌داده واقعی و بزرگ از مسیرهای شهری امتحانش کردن و نتیجه‌ش این شده که تو همه معیارها (metrics – یعنی اون شاخص‌هایی که باشون مدل‌ها رو مقایسه می‌کنن) از مدل‌های رقیب بهتر جواب داده. یعنی هم دقت مسیرهاش بالاس، هم شباهت به واقعیت داره، هم دیگه کسی نمی‌تونه ببینه این مسیر مال کی بوده!

در کل، اگه خلاصه بخوام بگم؛ مدل Cardiff اومده مسیرهای آدم‌ها تو شهر رو هم خصوصی، هم دقیق و هم واقع‌گرایانه شبیه‌سازی می‌کنه. هم برای حریم خصوصی خوبه، هم برای کاربردهای باحال شهر هوشمند. و تازه میشه تنظیمش کرد که هر وقت داده‌ی خصوصی‌تر یا دقیق‌تر خواستیم، اونجوری تولید کنه. انصافاً ایده خیلی شات زده و باحاله!

اگه به هوش مصنوعی و داده‌های شهری علاقه دارین، احتمال زیاد Cardiff رو طی ماه‌های آینده بیشتر خواهید شنید چون حسابی داره موضوع رو جذاب و کاربردی پیش می‌بره.

منبع: +