یه دیتاست خفن از حرکت چشم و ماوس موقع سرچ کردن تو گوگل!

بذار روراست باشیم، اکثرمون وقتی داریم تو گوگل دنبال چیزی می‌گردیم، اصلاً حواسمون نیست که چطوری داریم بین نتایج بالا و پایین می‌چرخیم یا روی چی کلیک می‌کنیم! ولی خب، برای دانشمندا و محقق‌هایی که می‌خوان بدونن دقیقاً آدم‌ها چطور با صفحه نتایج گوگل (یعنی همون SERP یا Search Engine Results Page) تعامل دارن، این جزئیات خیلی مهمه.

تا حالا معمولاً کارشناس‌ها می‌اومدن با ردیابی حرکت ماوس سعی می‌کردن متوجه بشن حواسمون بیشتر کجاست یا چی بیشتر چشممون رو می‌گیره. ولی راستش این روش یه کم ارزون و راحت بود، اما خیلی دقیق نبود! چون بالاخره ممکنه هرکی یه جوری با ماوس کار کنه یا حتی فقط برای رد کردن وقت اون رو تکون بده! بعضیا هم آخر کار از خودشون درباره رفتارهاشون سؤال می‌کردن، که خب، یاد آدم ممکنه دقیق نباشه یا تحت تأثیر ذهنش باشه. به این میگن self-reported labels یا همون «برچسب‌هایی که کاربر خودش می‌گه».

حالا یه تیم خفن اومدن و برای اولین بار یه دیتاست حسابی ساختن که هم حرکت چشم (eye movement) رو ضبط کرده، هم حرکت ماوس (mouse movement)! برای ضبط حرکت چشم از دستگاه eye tracker استفاده کردن (این همون دستگاهیه که دقیقاً و لحظه به لحظه نشون می‌ده چشمت کجاها سرک کشیده). بعد دیگه همه‌چی عین واقعیت شده و خبری از حدس و گمان و حافظه آدم‌ها نیست!

توی این پروژه، تیم تونسته داده‌های کاملی از ۲۷۷۶ کوئری که بهش میگن transactional queries جمع کنه (یعنی جستجوهایی که معمولاً کاربر دنبال خریدن یه چیز یا انجام یه تراکنش هست). این داده‌ها توسط ۴۷ نفر جمع شده. یعنی واقعاً دیتاست قابل توجهیه و به خاطر ترکیبی که از حرکت چشم و ماوس داره، نمونه‌ش کمتر پیدا میشه.

چی توی این دیتاسته؟ بذار برات لیست کنم:
١. فایل HTML کامل هر صفحه نتایج (همراه با CSS و تصویرها) — یعنی هر چی تو صفحه بوده اونجا هست!
٢. اسکرین‌شات‌هایی که نشون میده همون موقع صفحه نتایج دقیقاً چه شکلی بوده.
٣. داده خام حرکت چشم کاربرها، که دقیقاً ثبت کرده چشم کاربر هر لحظه کجای صفحه بوده.
٤. داده حرکت ماوس کاربرها، یعنی هرجا ماوس رو بردن و روی چی کلیک کردن.
٥. باکس‌هایی که تبلیغات مستقیم (Direct Ads) و نتایج ارگانیک (یعنی نتیجه‌هایی که تبلیغ نیستن) تو صفحه نشون داده شدن کجاست، رو هم کامل ثبت کردن.
٦. چندتا اسکریپت آماده هم گذاشتن که بشه راحت‌تر داده‌ها رو برای تحلیل پردازش کرد (اسکریپت یعنی برنامه کوچولویی که کارایی مثل تمیز کردن و دوباره چیدمان داده‌ها رو انجام میده).

هدف اصلیشونم این بوده که به محققا و کسایی که دنبال تحلیل رفتار کاربرا تو موتور جستجو هستن، یه مرجع کامل بدن تا هر مدلی که می‌خوان آزمایش کنن و حتی تحقیقات جدیدی بسازن. خودشون هم یه سری آزمایش اولیه (بهش می‌گن Baseline Experiments یعنی تست‌هایی برای سنجش ابتدایی دیتاست) انجام دادن که ایده بده محققا دیگه تا چه چیزایی میشه رسید. مثلاً کلی مدل طبقه‌بندی (Classification Tasks یعنی مدل‌هایی که بر اساس داده‌ها پیش‌بینی می‌کنن تو کدوم گروه یا کلاس باید بذارن) رو تست کردن و نشون دادن دیتاست واقعاً به درد این مدلا می‌خوره.

اگه تو زمینه هوش مصنوعی، رفتار کاربر، یا حتی تبلیغات دیجیتال علاقه داری، این دیتاست می‌تونه کمک‌کننده باشه و نتایج خیلی کاربردی بده — چون هم دقیق و کامل جمع شده و هم همه‌چیزش مستنده، نه حدس و سوال از کاربر! خلاصه، کل داستان اینه که حالا دیگه میشه بفهمیم دقیقاً حواس کاربر موقع سرچ تو گوگل به چی‌ها پرت میشه، کجاها می‌مونه، و چی بیشتر توجهشو جلب می‌کنه. این یعنی مسیر باز شده برای کلی پروژه و تحقیق جدید!

منبع: +