تکیه آن به که بر این بحر معلق نکنیم!
عباس پورخصالیان - خرابی اخیر نرمافزار امنیت سایبری شرکتِ CrowdStrike که در روز 19 ژوئیۀ 2024 در ساعت 04:09 مطابق باUTC (گرنویچ) رخ داد و تا ساعت 05:27 به طول انجامید، پس از جایگزینی فایلهای پیکربندی معیوب، به طور موقت برطرف شد.
با این حال، طبق گفته مایکروسافت، قطعی همچنان تقریباً 8.5 میلیون دستگاه ویندوز یا کمتر از 1 درصد از تمام دستگاههای ویندوز را تا 6 ماه بعد تحت تأثیر قرار میدهد.
این خرابی باعث بروز اختلالاتی جهانگستر در کشورهایی از هر پنج قاره کرۀ زمین شد و بخشهای اقتصادی بزرگی مانند حمل و نقل هوایی، بانکداری، مراقبتهای بهداشتی و مدیریت آماد و پشتیبانی یا لجستیک را تحت تاثیر قرار داد.
نتیجه:
- مشاهیر بزرگ یا سِلِبریتیهای عرصههای هنر و علم و فناوری، us-centric بودن اینترنت را امری ضد امنیت سایبری برآورد کردند،
- بسیاری از آنها به مدیران شرکتها و نهادها توصیه کردند که مثلِ جورج کورتز، مدیر عامل هولدینگ CrowdStrike که از هرج و مرج ناشی از بهروزرسانی نرمافزار معیوب، بلافاصله پس از بروز آن، ابراز پشیمانی و معذرت خواهی کرد با تاکید بر این که این خرابی ناشی از یک حمله سایبری نبوده و نیست، و با این کار توانست آرامش نسبی در اوضاع به هم ریخته به وجود آورد، همواره پاسخگو، اخلاقی، صادق و شفاف باشند،
- از درس بزرگ این قطعی با ابعاد جهانی و اثرات آبشاری خرابیهای زنجیرهای آن بیاموزند و تکیه بر یک فروشنده واحد برای رفع نیازهای حیاتی امنیت سایبری یک شرکت یا یک نهاد دولتی، نکنند،
- بخش اقتصادی امنیت سایبری را رقابتی سازماندهی کنند،
- و در اجرای طرحهای افزونگی (redundancy) و متنوعسازی فنی و جغرافیایی (Technical and geographical diversity) در زیرساختهای فناوری اطلاعات برای کاهش خطرات آتی بکوشند.
- بررسی علت احتمالی خرابی
علت خرابی اخیر نرمافزار امنیت سایبری شرکتِ CrowdStrike [با نام تجاری فاکُن (Falcon) و نسخه 7.11 و بالاتر] به احتمال قوی، وجود خطاهای منطقی در به روز رسانی نرمافزار و به طور کلی برنامه نویسی آن بوده است که البته خطایی نسبتاً رایج است. خطاهای منطقی زمانی رخ میدهند که کد بدون خطاهای نحوی اجرا میشود اما به دلیل منطق معیوب، نتایج نادرستی به بار میآورد یا تولید میکند. تشخیص چنین خطاهایی میتواند چالش برانگیز باشد، به ویژه در سیستمهای پیچیده، زیرا اغلب برای مدتی پنهان میمانند و باعث خرابی یا هشدارهای قابل مشاهده نمیشوند.
در توسعه نرمافزار، خطاهای منطقی میتواند از منابع مختلفی از جمله الگوریتمهای نادرست، عبارات شرطی نامناسب و تفسیر نادرست از نیازمندیهای سیستمی ناشی شود. مطالعات نشان میدهد که برنامه نویسان مبتدی اغلب دچار این خطاها میشوند.
آزمایش منظم، اِشکالزدایی و بررسی کد، استراتژیهایی ضروری برای شناسایی و کاهش خطاهای منطقی هستند و در نتیجه، وقوع حوادث ناگوار در بهروزرسانیهای نرمافزار را کاهش میدهند.
- کارکردِ نسخۀ 7.11 و بالاترِ نرمافزار امنیتیِCrowdStrike
کارکرد نرمافزار امنیتیِ شرکت CrowdStrike با نام تجاری فاکُن (Falcon) و نسخه 7.11 و بالاتر، ایمن سازیِ Endpoints یا «نقاط انتهایی» برای شبکههای رایانهای (Computer Networks) است. «نقاط انتهایی»، پلِ میان پایانههای متصل به شبکه رایانهای و رایانههای شبکه مربوط هستند. به عبارتی دیگر: «نقاط انتهایی»، میانجی مابین لپتاپها، تبلتها، پی.سیها و گوشیهای هوشمندِ موجود در دوردست و متصل به شبکۀ رایانهای هستند.
کارکرد فاکُن، آشکارساری رویدادهای نقاط انتهایی و پاسخگویی یا Endpoints Detection and Response (EDR) است.
- قربانیان حادثه
تعداد انسانهای گرفتار در حادثۀ خطای بهروزرسانی نرمافزار امنیت سایبریِ CrowdStrike هنوز قابل احصا نیست ولی یقیناً هر شبکۀ رایانهاییی که از نرمافزار فاکُن برای تأمین امنیت سایبریِ نقاط انتهایی خود بهرهمند بود و هر لپتاپ، تبلت، پی.سی و گوشی هوشمندِ دارای ویندوز مایکروسافت که متصل به پلتفرم فاکُن بودند و از برنامۀ کاربردیِ Blue Screen of Death یا «صفحۀ آبی مرگِ» مایکروسافت استفاده میکردند، در روز 19 ژوئیۀ 2024 دچار حادثه و قربانی خطای بهروزرسانی CrowdStrike شدند.
تعداد این قربانیان سیستمی خطای نرمافزار فالکُن در سراسر جهان، از 8 میلیون و پانصد رایانه تجاوز میکند. به عبارت دیگر: خرابی اخیر بهروزرسانیCrowdStrike عمدتاً میزبانهای ویندوز را تحت تأثیر قرار داد ولی برای کاربران سیستمهای مک و لینوکس بیاثر بود.
- کشورهای درگیر
بهروزرسانی اخیر نرمافزار CrowdStrike باعث اختلالاتی در چندین کشور شد، از جمله: ایالات متحده، انگلستان، آلمان، استرالیا، نیوزلند، ژاپن، کره جنوبی، اسرائیل، امارات متحدۀ عربی، اوگاندا و تعدادی دیگر از کشورها.
- خدمات حیاتی درگیر
این قطعی گسترده، خدمات حیاتی مانند خطوط هوایی، بانکها، بیمارستانها و مدیریتهای آماد و پشتیبانی یا لجستیک را تحت تاثیر قرار داد و منجر به چالشهای عملیاتی قابل توجهی در سطح جهانی شد. خطوط هوایی بزرگی مانند «تورکیش ایر»، «دلتا» و «امریکن ایرلاینز» به ویژه تحت تأثیر قرار گرفتند که منجر به لغو و تاخیر پروازها در مناطق مختلف شد [تنها خطوط هوایی دلتا، 777 پرواز لغو شده اش در سطح جهان را گزارش کرد که نشان دهنده تأثیرات عملیاتی قابل توجهی است. این قطعی روی 674620 رابطه مستقیم با مشتری و بیش از 49 میلیون رابطۀ غیرمستقیم تأثیر سوء گذاشت که نشان دهنده پیامدهای اقتصادی گسترده است].
در امارات متحده عربی، گزارشهایی از اشکالات فنی بر دستگاههای خودپرداز و سیستمهای پرداخت وجود دارد که حاکی از سطحی از اختلال مربوط به حادثه CrowdStrike است اما خطوط هوایی بزرگ در امارات به دلیل نقص نرمافزار CrowdStrike، کمترین اختلال را گزارش کردند.
اگرچه در قطر، اختلالی از بابت حادثه CrowdStrikeگزارش نشد و قطر ایرویز اعلام کرد که عملیات پروازهای آن تحت تأثیر قرار نگرفته است، اما به مسافرانی که به اروپا و ایالات متحده سفر میکردند، اطلاع رسانی میکرد که پروازهای ایشان با تاخیر انجام خواهد شد.
خطوط هوایی امارات هم شبیه به خطوط هوایی قطر تایید کرد که حادثه CrowdStrike هیچ تاثیری بر عملیات پروازی آن نداشته است، اما به دلیل اختلالات ناشی از حادثه CrowdStrike به تاخیر در برنامه پروازهای برخی از فرودگاههای اروپا و ایالات متحده اشاره کرد.
لذا در فرودگاه بینالمللی دبی مسافرانِ برخی از خطوط هوایی با مشکلات موقتی مواجه شدند، اما فرودگاه مذکور به سرعت فعالیت عادی خود را از سر گرفت.
در تایوان، خرابی نرمافزار CrowdStrike بر خدمات الکترونیکی مختلف، به ویژه در بخش مراقبتهای بهداشتی تأثیر گذاشت. بیمارستانها با اختلالاتی مواجه شدند که آنها را مجبور کرد تا به عملیات دستی بازگردند زیرا سیستمهای دیجیتالی آنها غیرفعال شده بود. علاوه بر این، ادارات دولتی و مؤسسات مالی تایوان احتمالاً با چالشهایی مواجه بودند، اگرچه جزئیات خاصی در مورد اختلالات آنها هنوز گزارش نشده.
در اسرائیل آنچه تحت تأثیر خرابی نرمافزار CrowdStrikeدچار اختلال شد، عمدتاً در بخش مراقبتهای بهداشتی قرار داشت: بیش از دوازده بیمارستان در اسرائیل تحت تأثیر قرار گرفتند و کارکنان امور اجرایی آنها مجبور به کار دستی شدند زیرا خدمات دیجیتالی بخش مراقبتهای بهداشتی در دسترس نبود.
وزارت بهداشت اسرائیل مشکلات مربوط به سیستمهای الکترونیکی اورژانس پزشکی را گزارش کرد و به ساکنان شهرکها توصیه کرد در صورت عدم دسترسی به خدمات با پلیس تماس بگیرند.
در اسرائیل، برخی از شرکتهای نرمافزاری اسرائیلی حمایت تبلیغاتی/دیپلماتیکی خود را از قربانیان حادثۀ CrowdStrike ابراز میکردند و بسیاری از آنها این حادثه را فرصتی مناسب یافتند برای به دست آوردن سهم بازار در اسرائیل.
- درسهای آموخته از حادثۀ CrowdStrike
- همۀ مسؤولان باید بیاموزند که پاسخگویی سریع و صادقانه اوضاع آشفته را آرام میکند! مدیر عامل هولدینگ CrowdStrike، جورج کورتز، از هرج و مرج ناشی از بهروزرسانی نرمافزار معیوب بلافاصله پس از بروز آن، ابراز پشیمانی و معذرت خواهی کرد، با تاکید بر این که این خرابی ناشی از یک حمله سایبری نبوده و نیست.
- این قطعی، ابعاد جهانی و اثرات آبشاری خرابی نرمافزارهای حیاتی را به درستی نشان داد و ماهیت بهم پیوستۀ سیستمهای فناوری اطلاعات را برملا و برجسته کرد
- و لذا بدون شک منجر به چالشهای عملیاتی قابل توجهی در حوزۀ مهندسی تابآورسازی و مدیریت تابآوری اقتصاد دیجیتالی و دولت الکترونیکی خواهد شد؛ زیرا که اغلب سیاستگذاران و کارشناسان فعال در حوزۀ امنیت ملی فضای سایبری فهمیدند که تکیه بر یک فروشنده واحد برای رفع نیازهای حیاتی امنیت سایبری یک شرکت یا یک نهاد دولتی، غلط است
- و در این بخش (بخش اقتصادی امنیت سایبری) باید رقابتی عمل کرد و بر نیاز به بهبود شیوههای بهروزرسانی نرمافزار و اجرای طرحهای افزونگی (redundancy) و متنوعسازی فنی و جغرافیایی (Technical and geographical diversity) در زیرساختهای فناوری اطلاعات برای کاهش خطرات آتی تأکید کرد.
- کارشناسان همچنین باید بر نیاز به بهروزرسانی تدریجی نرمافزارها تأکید کنند، تا بهروزرسانی باعث ایجاد واکنشهای زنجیرهای فاجعهبار در شبکههای به هم پیوسته نشود.
- این حادثه، شکنندگی زیرساختهای دیجیتالی مدرن و اهمیت اولویت دادن به طرحهای انعطافپذیرسازی بجای بهینهسازی صرف در سیستمهای فناوری را به وضوح نشان داد و خاطر نشان کرد که:
- با اجرای [به قول من] ترادیسی دیجیتالی (digital transformation) [و به قول معروف: با پیادهسازی تحول دیجیتالی در جامعه، سیستمهای دستی نباید کاملاً معدوم شوند و تجهیزات دستی و پرسنل پشتیبان برای بازگشت سریع به دیوانسالاری دستی باید همواره در دسترس باشند. این دسترسی به سستمهای دستی تضمین میکند که در صورت خرابی یک مؤلفه اصلی، عملیات اجرایی دچار وقفه نشوند و ادامه یابند.
- برای شناسایی مشکلات احتمالی، قبل از اینکه منجر به خرابی شوند، تعمیر و نگهداری و نظارت منظم را باید انجام داد و سیستمها را به طور منظم برای تعیین نقاط شکست ارزیابی کرد.
- فرآیندهای مستندسازی رویدادها به عنوان درسهای آموخته برای آموزش متقابل کارکنان به منظور پیشگیری از تکرار خطاهای مشابه و کاهش اتکا به یک فرد با دانش تخصصی یا به یک سیستم از ملزومات هر شرکت و هر نهاد است. باید اطمینان حاصل کرد که چندین نفر میتوانند عملکردهای حیاتی را انجام دهند.
- باید دستورالعملهای واضح و کنترل نسخه برای صفحات گسترده و فرآیندهای دستی ایجاد کرد. خطاها در صفحات گسترده منبع رایج خرابیهای تک نقطه ای هستند.
- باید مخاطرات را به ارایهدهندگان خدمات برونسپاری برای عملکردهایی مانند حسابداری و خدمات فناوری اطلاعات منتقل کرد. ارائهدهندگان خدمات برون سپاری معتبر باید بتوانند افزونگی و تخصص لازم را ارائه دهند.
- پیادهسازی سیستمهای نظارت و هشدار برای علامتگذاری مشکلات باید قبل از بروز بحران و تشدید آنها پیشبینی شوند.
- اگرچه محال است شبکهها و سیستمهای را بدون هیچ نقطه خرابی از پایه طراحی کرد ولی باید در این زمینه کوشید. استفاده از فناوری سوئیچینگ بستهای، معماری میکروسرویسها و اقدامات امنیتی اضافی همگی میتوانند کمک کننده باشند.
- پیادهسازی سیستمهای بازیابی خودکار و پلتفرمهای ارکستراسیون فرآیندهای بازیابی خودکار باید در طرح تابآورسازی فناوری اطلاعات در فاز برنامهریزی دیده شوند تا به سیستم کل اجازه دهند که به سرعت پس از خرابی، عملکرد خود را بازیابی کند و زمان خرابی و اختلال عملیاتی را به حداقل برساند.
- اجرای طرحهایی برای کاهش خطا، نیز از ضروریات مهندسی تابآورسازی است. اتوماسیون، خطای انسانی را با انجام کارهای تکراری کاهش میدهد، کارهایی که اغلب منابع خرابی هستند، بنابراین قابلیت اطمینان کلی سیستم را افزایش میدهد.
- حفاظت مداوم از دادهها (Continuous Data Protection: CDP ) نیز ضروری است زیرا که نقشی کلیدی در کاهش نقاط خرابی منفرد (Single Points of Failure: SPOF) ایفا میکند.
بالاترین درس آموخته از ماجرای خرابی اخیر نرمافزار امنیت سایبری شرکتِ CrowdStrike، این نکته است که فناوران هم انسانهایی جایزالخطا هستند. پس (به قول حافظ در غزلِ: «ما نگوییم بد و میل به ناحق نکنیم […]») تکیه آن به که بر این بحر معلق نکنیم! و بدانیم که فضای سایبری با همۀ محاسن، اهمیت، اولویتها و ضروریاتاش در جهان مدرن، مصداق همان بحر معلق است!
در نهایت یک درس مهم برای ما ایرانیها شایان ذکر است: اگر کشور ایران و اقتصاد دیجیتالی بزرگش از این حادثه مصون ماند، البته که علتش تحریمها بود ولی نیاییم این علت را تقدیس کنیم! هم در ارتقاء امنیت سایبری کشور و هم در رفع تحریمها به منظور حضور فعال در جهان باید کوشید!(منبع:عصرارتباط)