بذار روراست باشیم، اکثرمون وقتی داریم تو گوگل دنبال چیزی میگردیم، اصلاً حواسمون نیست که چطوری داریم بین نتایج بالا و پایین میچرخیم یا روی چی کلیک میکنیم! ولی خب، برای دانشمندا و محققهایی که میخوان بدونن دقیقاً آدمها چطور با صفحه نتایج گوگل (یعنی همون SERP یا Search Engine Results Page) تعامل دارن، این جزئیات خیلی مهمه.
تا حالا معمولاً کارشناسها میاومدن با ردیابی حرکت ماوس سعی میکردن متوجه بشن حواسمون بیشتر کجاست یا چی بیشتر چشممون رو میگیره. ولی راستش این روش یه کم ارزون و راحت بود، اما خیلی دقیق نبود! چون بالاخره ممکنه هرکی یه جوری با ماوس کار کنه یا حتی فقط برای رد کردن وقت اون رو تکون بده! بعضیا هم آخر کار از خودشون درباره رفتارهاشون سؤال میکردن، که خب، یاد آدم ممکنه دقیق نباشه یا تحت تأثیر ذهنش باشه. به این میگن self-reported labels یا همون «برچسبهایی که کاربر خودش میگه».
حالا یه تیم خفن اومدن و برای اولین بار یه دیتاست حسابی ساختن که هم حرکت چشم (eye movement) رو ضبط کرده، هم حرکت ماوس (mouse movement)! برای ضبط حرکت چشم از دستگاه eye tracker استفاده کردن (این همون دستگاهیه که دقیقاً و لحظه به لحظه نشون میده چشمت کجاها سرک کشیده). بعد دیگه همهچی عین واقعیت شده و خبری از حدس و گمان و حافظه آدمها نیست!
توی این پروژه، تیم تونسته دادههای کاملی از ۲۷۷۶ کوئری که بهش میگن transactional queries جمع کنه (یعنی جستجوهایی که معمولاً کاربر دنبال خریدن یه چیز یا انجام یه تراکنش هست). این دادهها توسط ۴۷ نفر جمع شده. یعنی واقعاً دیتاست قابل توجهیه و به خاطر ترکیبی که از حرکت چشم و ماوس داره، نمونهش کمتر پیدا میشه.
چی توی این دیتاسته؟ بذار برات لیست کنم:
١. فایل HTML کامل هر صفحه نتایج (همراه با CSS و تصویرها) — یعنی هر چی تو صفحه بوده اونجا هست!
٢. اسکرینشاتهایی که نشون میده همون موقع صفحه نتایج دقیقاً چه شکلی بوده.
٣. داده خام حرکت چشم کاربرها، که دقیقاً ثبت کرده چشم کاربر هر لحظه کجای صفحه بوده.
٤. داده حرکت ماوس کاربرها، یعنی هرجا ماوس رو بردن و روی چی کلیک کردن.
٥. باکسهایی که تبلیغات مستقیم (Direct Ads) و نتایج ارگانیک (یعنی نتیجههایی که تبلیغ نیستن) تو صفحه نشون داده شدن کجاست، رو هم کامل ثبت کردن.
٦. چندتا اسکریپت آماده هم گذاشتن که بشه راحتتر دادهها رو برای تحلیل پردازش کرد (اسکریپت یعنی برنامه کوچولویی که کارایی مثل تمیز کردن و دوباره چیدمان دادهها رو انجام میده).
هدف اصلیشونم این بوده که به محققا و کسایی که دنبال تحلیل رفتار کاربرا تو موتور جستجو هستن، یه مرجع کامل بدن تا هر مدلی که میخوان آزمایش کنن و حتی تحقیقات جدیدی بسازن. خودشون هم یه سری آزمایش اولیه (بهش میگن Baseline Experiments یعنی تستهایی برای سنجش ابتدایی دیتاست) انجام دادن که ایده بده محققا دیگه تا چه چیزایی میشه رسید. مثلاً کلی مدل طبقهبندی (Classification Tasks یعنی مدلهایی که بر اساس دادهها پیشبینی میکنن تو کدوم گروه یا کلاس باید بذارن) رو تست کردن و نشون دادن دیتاست واقعاً به درد این مدلا میخوره.
اگه تو زمینه هوش مصنوعی، رفتار کاربر، یا حتی تبلیغات دیجیتال علاقه داری، این دیتاست میتونه کمککننده باشه و نتایج خیلی کاربردی بده — چون هم دقیق و کامل جمع شده و هم همهچیزش مستنده، نه حدس و سوال از کاربر! خلاصه، کل داستان اینه که حالا دیگه میشه بفهمیم دقیقاً حواس کاربر موقع سرچ تو گوگل به چیها پرت میشه، کجاها میمونه، و چی بیشتر توجهشو جلب میکنه. این یعنی مسیر باز شده برای کلی پروژه و تحقیق جدید!
منبع: +