ماجرای عجیب خزنده‌های مخفی Perplexity و شاکی بودن Cloudflare!

خب رفقا، بذارین براتون یه داستان جالب از دنیای هوش مصنوعی تعریف کنم! موضوع سر یه استارتاپ به اسم Perplexity هست که تو حوزه جستجوی هوشمند کار می‌کنه. حالا داستان چیه؟ Cloudflare که یه شرکت معروف تو زمینه خدمات زیرساخت اینترنتیه (یعنی همونایی که کمک می‌کنن سایت‌ها امن‌تر و سریع‌تر کار کنن)، گفته Perplexity اومده با یه حرکت خفن (ولی بحث‌برانگیز!) قوانین دسترسی به سایت‌ها رو دور زده!

ماجرا از اینجا شروع شد که کلی سایت، واسه جلوگیری از خزیدن بات‌های هوش مصنوعی مثل بات‌های Perplexity، یه فایل به اسم robots.txt می‌ذارن تو سایتشون. این فایل همون جور که از اسمش پیداست، برای گفتن به ربات‌هاست که “آقا! اینجا نیای!” یا “فقط اینجا رو مجاز داری بخونی!”. اما Cloudflare میگه Perplexity وقتی می‌بینه راه بسته‌س، هویتش رو قایم می‌کنه و دیگه همونی که باید باشه، نشون نمی‌ده. این کار رو تو دنیای وب بهش میگن “stealth crawling”، یعنی خزیدن مخفیانه!

چی کار می‌کنن؟ خب اول با هویت واقعی خودشون مثل “PerplexityBot” یا “Perplexity-User” وارد میشن. اگه ببینن دسترسی ندارن، یه حقه جالب می‌زنن: “user agent” رو عوض می‌کنن. حالا user agent چیه؟ همون اطلاعاتی که به سایت می‌گه تو چه مرورگری و چه سیستمی هستی، یا اینکه اصلاً رباتی یا آدم! اونا خودشون رو به جای Google Chrome روی مکینتاش جا می‌زنن که کسی شک نکنه! حتی از IPهای متغیر هم استفاده می‌کنن، یعنی هی آدرس IP عوض می‌شه تا نشه راحت ردشون رو گرفت. جالب‌تر اینکه حتی شماره شبکه مستقل (ASN) عوض می‌کنن؛ این یه شماره‌س که نشون می‌ده پشت این IPها چه اپراتور یا سازمانیه!

Cloudflare گفته این حرکات تو ده‌ها هزار دامنه و میلیون‌ها درخواست روزانه رخ داده! خلاصه، انگار یارو هر جوری بتونه، بالاخره می‌خواد بره تو سایت‌ها و محتوا جمع کنه. البته بحث جمع کردن محتوا به کمک هوش مصنوعی (که بهش میگن scraping یا واکاوی) خودش کلی جنجال داشته، مخصوصاً وقتی بدون اجازه از پشت paywall (یعنی دیوار پرداخت؛ همون صفحاتی که باید پول بدی تا ببینی) یا robots.txt رد می‌شن.

جالبتر اینه که پارسال هم کلی سر همین داستان برای Perplexity حاشیه درست شد و مدیرش انداخت گردن بات‌های شخص ثالث، ولی حالا دوباره پای خودشون وسطه. از اون طرف سخنگوی Perplexity کل گزارش Cloudflare رو یه “شو تبلیغاتی” خونده و گفته کلی سو تفاهم توش هست.

Cloudflare هم دیگه از لیست “بات‌های معتبر” اسم Perplexity رو حذف کرده. تازه خودش یه سری امکانات داده که هر کی خواست، بتونه راحت جلوی این خزنده‌های مخفی رو بگیره.

یه نکته مهم دیگه: مدیر عامل Cloudflare کلاً از طرفدارای سرسخت مقابله با هوش مصنوعی بی‌در و پیکره و می‌گه این بات‌ها واسه ناشران محتوا «تهدید وجودی» هستن. اخیراً هم Cloudflare سرویس جدیدی راه انداخته که سایت‌ها می‌تونن به شرکت‌های هوش مصنوعی بگن آقا اگه می‌خواین تو محتوای ما بچرخین و داده جمع کنین، باید پول بدین! حتی تازه به ‌طور پیش‌فرض، بات‌های هوش مصنوعی رو بلاک می‌کنه.

خلاصه این داستان نشون میده که جنگ بین سازنده‌های هوش مصنوعی و کسایی که صاحب محتوا هستن، داره هی جدی‌تر میشه و هر طرف هم حقایق خودش رو داره! نظر شما چیه؟ این حقه‌ها تکنولوژیه یا انصافاً یه کم کار کثیف؟

منبع: +