قطعی Cloudflare: ماجرای یه توقف کوچیک و درس‌های بزرگی که بهمون داد!

احتمالاً این خبر به گوشتون رسیده که چند روز پیش Cloudflare یه قطعی داشت و کلی از سایتای معروف نتونستن درست کار کنن یا اصلاً بالا نیومدن. حق دارین اگه Cloudflare رو نشناسین؛ Cloudflare یکی از شرکتاییه که به بیشتر سایت‌های بزرگ کمک می‌کنه تا هم سرعتشون زیاد بشه، هم جلوی حملات مختلف رو بگیرن. خلاصه، مثل لباس ضدگلوله‌ایه برای اینترنت!

چی شد؟
ماجرا این بود که صبح سه‌شنبه (ساعت ۶:۳۰ صبح به وقت شرق آمریکا) Cloudflare اعلام کرد با یه مشکل داخلی روبرو شده. اول فکر می‌کردن “چیز جدی نیست!” اما تقریباً هشت ساعت طول کشید و سرویس‌ها یا قطع بودن یا دوباره وصل می‌شدن.

تازه خیلی‌ها که DNS یا همون “سیستم نام دامنه” شون هم روی Cloudflare بود، اصلاً نمی‌تونستن موقتاً برند سراغ جای دیگه، چون حتی پنل دسترسی به تنظیماتشون هم داون بود. (DNS یعنی سیستمی که وقتی یه اسم سایت رو می‌زنید، آدرس آی‌پی واقعیِ سایت رو پیدا می‌کنه تا بتونه براتون بالا بیاد.) با این شرایط بعضی سایت‌ها مجبور شدن یه جورایی کل محافظت‌ هاشونو دور بزنن تا فقط سایت در دسترس باشه.

حالا چرا این ماجرا مهمه؟
اینجاست که ماجرا جالب میشه! کارشناس‌های امنیت معتقدن: این قطعی کوتاه Cloudflare، برای کلی از سایت‌ها مثل یه “تست نفوذ واقعی” (penetration testing یعنی امتحان اینکه آیا هکرها می‌تونن چیزی رو هک کنن یا نه) بود. یعنی وقتی این سپر دفاعیِ عظیم کنار رفت، معلوم شد سایت‌ها واقعاً چقدر خودشون محکم و بی‌دردسرن و بدون Cloudflare چند مرده حلاج هستن.

آرون ترنر از IANS Research گفت Cloudflare توی گرفتن و حذف حملات سطح نرم‌افزاری، مثل باگ‌هایی از نوع SQL Injection (یه روش رایج هک سایت)، Cross-site scripting یا حملات رباتی، واقعاً قویه. (SQL Injection یعنی هکر بیاد اطلاعات سایت رو با کدهای مشکوک بگیره و خرابکاری کنه. Cross-site scripting هم یعنی هکر کدی بنویسه که کاربر رو به دام بندازه.) ولی همین باعث شده بود توسعه‌دهنده‌ها خیلی وقتا به خودشون فشار نیارن و به آزمایش امنیتی درجه‌یک نیاز نداشته باشن چون مطمئن بودن Cloudflare حواسش هست.

طبق گفته‌ترنر، توی بازه هشت ساعته قطعی، بعضی سایت‌های مهم کاملاً بدون این سپر دفاعی رفتن جلو. حالا شرکت‌ها باید دقیق لاگ‌های (یعنی گزارش فعالیت‌های سایت) اون مدت رو بررسی کنن که ببینن آیا واقعاً حمله جدی شد یا فقط یه عالمه سر و صدا بود. چون با قطعی Cloudflare احتمالاً گروه‌های هکری و خرابکارها هم فهمیدن که وقت شکارشونه! آخه معمولاً وقتی کارشون گیره Cloudflare هست، اما الان دیدن فرصت پیش اومده و سپر کنار رفته و می‌تونن حمله‌های جدید بزنن.

نیکول اسکات از Replica Cyber هم گفت این قطعی برای همه شبیه یه “تمریـن رایگان بحران” بود—even اگه خودتون نمی‌خواستین! به قولش، سازمان‌ها باید چند تا سؤال مهم از خودشون بپرسن:
۱. چی رو خاموش یا دور زدن؟ (مثلاً WAF یعنی Web Application Firewall یا همون دیوار آتیش نرم‌افزاری، محافظت در برابر ربات‌ها، یا مسدود کردن کشورها)
۲. چه تغییراتی ناگهانی توی DNS یا مسیر اینترنتی دادن؟ و کی تأیید کرد؟
۳. کسی رفت سمت دستگاه شخصی، وای‌فای خونه یا سرویس ابری عجیب‌غریب تا کارش عقب نمونه؟
۴. کسی سرویس موقت یا حساب کاربری جدید درست کرد که بعداً یادش رفت برش داره؟
۵. اصلاً برنامه‌ای هست که بعداً این تغییرات جمع شن یا باقی می‌مونن؟
۶. برای دفعه بعد برنامه fallback (یعنی نقشه پشتیبان مشخص) دارن یا باز همه باید فی‌البداهه دست به کار شن؟

در نهایت خود Cloudflare توی یه گزارش گفت این قطعی نه بخاطر هک یا حمله بدافزار بوده، بلکه بخاطر یه تغییر ساده توی مجوزهای دیتابیسشون بوده. این تغییر باعث شد یه فایل به اسم “feature file” واسه مدیریت ربات‌ها، بیخودی بزرگ بشه و همه سرورهای Cloudflare مجبور بشن هر چی دارن با این فایل جدید همگام کنن—و همین قضیه باعث داون شد.

یه نکته مهم اینه که Cloudflare خودش میگه حدود ۲۰٪ کل سایت‌های جهان از سرویسش استفاده می‌کنن! یعنی با اینکه فقط یک قطعی کوتاه اتفاق افتاد، اما می‌شه فهمید چقدر اینترنت کل دنیا به چند تا شرکت از جمله Cloudflare، AWS و Azure گره خورده و این یعنی هر کدومشون قطع بشن، کلی سایت از دسترس خارج می‌شن.

مارتین گرینفیلد، مدیر شرکت Quod Orbis هم یه توصیه جالب داشت: “همه تخم مرغ‌هات رو تو یه سبد نذار!” یعنی چی؟ یعنی مثلاً WAF و محافظت DDoS (حملات شدید به سایت برای اینکه قطعش کنن) رو بین شرکت‌های مختلف تقسیم کن. DNS چند جایی داشته باش. برنامه جداسازی سرویس‌ها رو داشته باش که اگه یه جا داون شد، کل سیستمت بهم نریزه. خلاصه، وابستگی به یه سرویس‌دهنده، ریسک بزرگیه!

ته ماجرا: این قطعی یه هشدار بزرگ بود برا همه تا یادشون بیاد امنیت واقعی یعنی آمادگی برای هر شرایطی و اینکه نباید همه چیز رو بسپاری دست یه شرکت—even اگه Cloudflare باشه!

منبع: +