احتمالاً این خبر به گوشتون رسیده که چند روز پیش Cloudflare یه قطعی داشت و کلی از سایتای معروف نتونستن درست کار کنن یا اصلاً بالا نیومدن. حق دارین اگه Cloudflare رو نشناسین؛ Cloudflare یکی از شرکتاییه که به بیشتر سایتهای بزرگ کمک میکنه تا هم سرعتشون زیاد بشه، هم جلوی حملات مختلف رو بگیرن. خلاصه، مثل لباس ضدگلولهایه برای اینترنت!
چی شد؟
ماجرا این بود که صبح سهشنبه (ساعت ۶:۳۰ صبح به وقت شرق آمریکا) Cloudflare اعلام کرد با یه مشکل داخلی روبرو شده. اول فکر میکردن “چیز جدی نیست!” اما تقریباً هشت ساعت طول کشید و سرویسها یا قطع بودن یا دوباره وصل میشدن.
تازه خیلیها که DNS یا همون “سیستم نام دامنه” شون هم روی Cloudflare بود، اصلاً نمیتونستن موقتاً برند سراغ جای دیگه، چون حتی پنل دسترسی به تنظیماتشون هم داون بود. (DNS یعنی سیستمی که وقتی یه اسم سایت رو میزنید، آدرس آیپی واقعیِ سایت رو پیدا میکنه تا بتونه براتون بالا بیاد.) با این شرایط بعضی سایتها مجبور شدن یه جورایی کل محافظت هاشونو دور بزنن تا فقط سایت در دسترس باشه.
حالا چرا این ماجرا مهمه؟
اینجاست که ماجرا جالب میشه! کارشناسهای امنیت معتقدن: این قطعی کوتاه Cloudflare، برای کلی از سایتها مثل یه “تست نفوذ واقعی” (penetration testing یعنی امتحان اینکه آیا هکرها میتونن چیزی رو هک کنن یا نه) بود. یعنی وقتی این سپر دفاعیِ عظیم کنار رفت، معلوم شد سایتها واقعاً چقدر خودشون محکم و بیدردسرن و بدون Cloudflare چند مرده حلاج هستن.
آرون ترنر از IANS Research گفت Cloudflare توی گرفتن و حذف حملات سطح نرمافزاری، مثل باگهایی از نوع SQL Injection (یه روش رایج هک سایت)، Cross-site scripting یا حملات رباتی، واقعاً قویه. (SQL Injection یعنی هکر بیاد اطلاعات سایت رو با کدهای مشکوک بگیره و خرابکاری کنه. Cross-site scripting هم یعنی هکر کدی بنویسه که کاربر رو به دام بندازه.) ولی همین باعث شده بود توسعهدهندهها خیلی وقتا به خودشون فشار نیارن و به آزمایش امنیتی درجهیک نیاز نداشته باشن چون مطمئن بودن Cloudflare حواسش هست.
طبق گفتهترنر، توی بازه هشت ساعته قطعی، بعضی سایتهای مهم کاملاً بدون این سپر دفاعی رفتن جلو. حالا شرکتها باید دقیق لاگهای (یعنی گزارش فعالیتهای سایت) اون مدت رو بررسی کنن که ببینن آیا واقعاً حمله جدی شد یا فقط یه عالمه سر و صدا بود. چون با قطعی Cloudflare احتمالاً گروههای هکری و خرابکارها هم فهمیدن که وقت شکارشونه! آخه معمولاً وقتی کارشون گیره Cloudflare هست، اما الان دیدن فرصت پیش اومده و سپر کنار رفته و میتونن حملههای جدید بزنن.
نیکول اسکات از Replica Cyber هم گفت این قطعی برای همه شبیه یه “تمریـن رایگان بحران” بود—even اگه خودتون نمیخواستین! به قولش، سازمانها باید چند تا سؤال مهم از خودشون بپرسن:
۱. چی رو خاموش یا دور زدن؟ (مثلاً WAF یعنی Web Application Firewall یا همون دیوار آتیش نرمافزاری، محافظت در برابر رباتها، یا مسدود کردن کشورها)
۲. چه تغییراتی ناگهانی توی DNS یا مسیر اینترنتی دادن؟ و کی تأیید کرد؟
۳. کسی رفت سمت دستگاه شخصی، وایفای خونه یا سرویس ابری عجیبغریب تا کارش عقب نمونه؟
۴. کسی سرویس موقت یا حساب کاربری جدید درست کرد که بعداً یادش رفت برش داره؟
۵. اصلاً برنامهای هست که بعداً این تغییرات جمع شن یا باقی میمونن؟
۶. برای دفعه بعد برنامه fallback (یعنی نقشه پشتیبان مشخص) دارن یا باز همه باید فیالبداهه دست به کار شن؟
در نهایت خود Cloudflare توی یه گزارش گفت این قطعی نه بخاطر هک یا حمله بدافزار بوده، بلکه بخاطر یه تغییر ساده توی مجوزهای دیتابیسشون بوده. این تغییر باعث شد یه فایل به اسم “feature file” واسه مدیریت رباتها، بیخودی بزرگ بشه و همه سرورهای Cloudflare مجبور بشن هر چی دارن با این فایل جدید همگام کنن—و همین قضیه باعث داون شد.
یه نکته مهم اینه که Cloudflare خودش میگه حدود ۲۰٪ کل سایتهای جهان از سرویسش استفاده میکنن! یعنی با اینکه فقط یک قطعی کوتاه اتفاق افتاد، اما میشه فهمید چقدر اینترنت کل دنیا به چند تا شرکت از جمله Cloudflare، AWS و Azure گره خورده و این یعنی هر کدومشون قطع بشن، کلی سایت از دسترس خارج میشن.
مارتین گرینفیلد، مدیر شرکت Quod Orbis هم یه توصیه جالب داشت: “همه تخم مرغهات رو تو یه سبد نذار!” یعنی چی؟ یعنی مثلاً WAF و محافظت DDoS (حملات شدید به سایت برای اینکه قطعش کنن) رو بین شرکتهای مختلف تقسیم کن. DNS چند جایی داشته باش. برنامه جداسازی سرویسها رو داشته باش که اگه یه جا داون شد، کل سیستمت بهم نریزه. خلاصه، وابستگی به یه سرویسدهنده، ریسک بزرگیه!
ته ماجرا: این قطعی یه هشدار بزرگ بود برا همه تا یادشون بیاد امنیت واقعی یعنی آمادگی برای هر شرایطی و اینکه نباید همه چیز رو بسپاری دست یه شرکت—even اگه Cloudflare باشه!
منبع: +