ماذا تعلمت "أميركان إيرلاينز" من عطل "كراود سترايك"؟

شركة الطيران الأميركية تتطرق لأول مرة إلى تفاصيل الشلل التقني الشامل الذي شهدته هذا الصيف

time reading iconدقائق القراءة - 14
موظفون يعملون في مركز عمليات \"أميركان إيرلاينز\" في فورت وورث في ولاية تكساس الأميركية - بلومبرغ
موظفون يعملون في مركز عمليات "أميركان إيرلاينز" في فورت وورث في ولاية تكساس الأميركية - بلومبرغ
المصدر:

بلومبرغ

استيقظت جسيكا تايلر على اتصال من مقر عملها عند الساعة 12:30 بعد منتصف ليل 19 يوليو، ولم تستغرب الاتصال بحد ذاته لأنها رئيسة مركز العمليات المتكاملة لدى "أميركان إيرلاينز". يقع المركز قرب مطار دالاس فورت وورث الدولي، وهو قلب شركة الطيران النابض، إذ يدير أكثر من 6000 رحلة يومياً.

المشاكل التي يتعامل معها المركز شديدة التنوع، ومنها عواصف شتوية وأعاصير صيفية وأعطال تقنية، حتى أن السحب البركانية التي قد تطرأ بين فينة وأخرى من اختصاصه.

يتطلب كلّ قرار يُتخذ في المركز مراعاة مجموعة عوامل واسعة، بدءاً من جداول صيانة واستبدال قطع غيار الطائرات، وصولاً إلى عدد ساعات العمل القصوى التي تتفق عليها الشركة عبر التفاوض مع النقابات.

فإن حطّت طائرة الرئيس الأميركي في أحد مطارات "أميركان إيرلاينز" الرئيسية وعطل ذلك العمليات لبضع ساعات، يتعين على المركز التعامل مع تداعيات ذلك. كذلك، إذا أقامت تايلور سويفت حفلاً في مدينة ما، فنفدت الغرف الفندقية ولم يعد لطواقم الشركة مكان مبيت، يصبح هذا من ضمن مسؤوليات المركز. تصف تايلر مهمة المركز بأنها "إدارة الفوضى".

لكن ما حدث في تلك الليلة أنذر بفوضى من مستوى آخر تماماً. ببساطة، توقفت أنظمة الكمبيوتر التي يعتمد عليها مركز العمليات لإدارة الرحلات من لحظة الإقلاع حتى لحظة الهبوط، وللتواصل مع الطيارين، ومتابعة الأحوال الجوية، ومراقبة التأخير، وكشف أي مشاكل تطرأ في المطارات. 

تبيّن لاحقاً أن كلّ هذه الأنظمة تستخدم برنامجاً أنتجته شركة "كراود سترايك" (CrowdStrike) المتخصصة بالأمن السيبراني التي تتخذ في تكساس مقراً لها.

قادت تايلر سيارتها لمسافة 20 دقيقة من منزلها نحو مجمّع "أميركان"، وحين وصلت، كان مرآب السيارات قرب المركز الكائن داخل بناء منخفض مكسوّ بزجاج لامع مقاوم للأعاصير، قد اكتظ بسيارات زملائها الذين تلقوا اتصالات مشابهة. توجهوا جميعاً إلى الطابق الثاني نحو صالة واسعة مكسوة بسجاد رمادي وتضم كثيراً من محطات العمل.

عطل يصيب 8.5 مليون جهاز كمبيوتر

كان المشهد لدى وصولهم أشبه بدخول مكان إنارته مبتذلة، فقد كانت الصالة خافتة الإضاءة، وبها صفوف مكاتب عليها شاشات، وتتدلى فوقها عشرات الشاشات المعلقة من قياس 82 بوصة. لكن بدل أن تظهر على الشاشات مسارات الطيران وخرائط المطارات وأنظمة الطقس والجداول الزمنية للرحلات، كانت جميعها تومض وتتقلب بين اللونين الأزرق والأسود. استذكرت تايلر ذلك قائلة: "كان الأمر مرعباً جداً".

سرعان ما اتضح أن أثر العطل لم يقتصر على "أميركان إيرلاينز"، فقد بدأت تصلها تقارير من إدارة الطواقم بأن الأنظمة معطلة أيضاً في الفنادق حيث كان المضيفون والطيارون يحاولون أن يمضوا ليلتهم. حتى شاشات كمبيوترات بعض موردي وقود "أميركان إيرلاينز" كانت في حالة "شاشات الموت الزرقاء"، إذ كانت عالقة في دورة إعادة تشغيل بلا نهاية.

تسببت حادثة "كراود سترايك" التي نجمت عن خلل في تحديث أحد برامج الشركة، بتعطيل 8.5 مليون جهاز كمبيوتر حول العالم، وتصدّرت عناوين الأخبار، مقدمة مثالاً صارخاً على هشاشة كثير من المنصات الرقمية التي تعتمد عليها حياتنا المعاصرة. 

يشكّل عطل كهذا حالة طوارئ لدى شركات الطيران، وكانت "أميركان إيرلاينز" تدير نحو 200 رحلة في الأجواء عندما توقفت الأنظمة عن العمل، فيما كانت مئات الرحلات الأخرى مجدولة للإقلاع في الصباح، ما أسفر عن شبكة متداخلة من رحلات الذهاب والإياب ورحلات الربط، التي كلما طال وقت العطل، تعقدت أكثر.

حتى في الظروف العادية، تتطلب إدارة أي شركة طيران معالجة كميات هائلة من البيانات، وكل قرار قد تترتب عليه أخطاء. تحاول شركات الطيران الاستفادة من التقدم التقني، كما هو الحال في جميع القطاعات، لكن ذلك يتطلب الموازنة بين ضغوط متعاكسة للتوفيق بين ضيق هوامش الربح ومطالب الهيئات الناظمة الاتحادية وقوة العمل شديدة الانتظام نقابياً قياساً إلى المعايير المعاصرة. يضاف إلى ذلك التحدي الأكبر، وهو كيفية تحديث منظومة عمل لا يمكن تعطيلها ولو للحظة.

تفعيل مركز القيادة

في الأحوال العادية، يشرف على مركز العمليات المتكاملة لدى "أميركان إيرلاينز" مدير يعمل في مناوبة من 12 ساعة في موقع يسمى "الجسر"، وهو مجموعة طاولات عمل ترتفع قليلاً عن مستوى ما سواها من المكاتب في صالة العمليات، ويجلس إلى جواره ممثلون عن مختلف الأقسام مثل العمليات الجوية والصيانة وجدولة دوامات الطاقم وخدمة العملاء وتقنية المعلومات وعمليات الرحلات والطيارين.

على أحد أطراف المركز، توجد غرفة كبيرة يمكن رؤيتها عبر نافذة ضخمة، لكن دخولها يتطلب إذناً خاصاً. تضمّ الغرفة صفوف مكاتب تبرز منها شاشات كمبيوتر بضغطة زر، وتغطي خريطتان ضخمتان من نوع "ميركاتور" جدارها الأمامي.

هذه الغرفة هي مركز القيادة، وعادةً ما تكون خاوية أو أنها تستخدم للتدريب، لكن في حالات الطوارئ، يلتقي فيها ممثلون عن جميع أقسام الشركة لتنسيق الاستجابة. فُعّل مركز القيادة حين طلبت وزارة الدفاع الأميركية من "أميركان إيرلاينز" وشركات طيران أخرى نقل آلاف الجنود والمواطنين من أفغانستان، خلال الانسحاب الفوضوي في 2021.

قال مسؤولون تنفيذيون في "أميركان إيرلاينز" تحدثوا لأول مرة عن كيفية تعاملهم مع أزمة "كراود سترايك" إنهم قرروا تفعيل مركز القيادة على الفور. وتوجهت تايلر مباشرة إلى مركز القيادة عند وصولها، وانضم إليها كبير مسؤولي العمليات في الشركة ديفيد سيمور.

إلغاء الرحلات

ما هي إلا دقائق حتى بدأت فرق تقنية المعلومات في "أميركان إيرلاينز" تجمع التفاصيل عن الحادثة، مستندة إلى منشورات عبر المنتديات التقنية، ومحادثات مع الشركاء التجاريين. لكن الأولوية القصوى كانت لضمان استمرار الاتصال بين موظفي التواصل في مركز العمليات المتكاملة والطيارين في الجوّ، سواء على متن الرحلات الداخلية التي أقلعت في ساعات متأخرة متجهة غرباً، أو الرحلات الليلية المتجهة إلى آسيا أو تلك القادمة من أوروبا. 

اكتشفت طواقم الطيران أن انقطاع الخدمة أثر على القنوات التي يستخدمونها للبقاء على تواصل مع الطائرات في الجوّ. وكحلّ مؤقت، طلبوا من مركز مراقبة الحركة الجوية التابع لإدارة الطيران الفيدرالية في وارنتون بولاية فرجينيا، نقل الرسائل إلى طياري "أميركان إيرلاينز"، وهي خاصية لم تتأثر بتعطل البرمجيات. وقد كان هذا حلاً كافياً ريثما تعود الأمور إلى نصابها.

لكن قنوات الاتصال لم تكن إلا واحدة من أنظمة كثيرة تعطلت. فقد توقفت أيضاً أنظمة الأمان في المطارات التي تسمح لأفراد الطاقم بالدخول إلى الجسور المفضية إلى الطائرات. كما تعطلت البرمجيات التي تتبع الحقائب المشحونة، وحتى مزودي الطعام الذين يتعاملون مع "أميركان إيرلاينز" ما عادوا قادرين على تقديم خدماتهم. 

بدا أن إعادة تشغيل الأنظمة أو التوصّل إلى حلّ بديل قد يطول، فيما سيستمر تفاقم المشاكل. شبّهت تايلر ما جرى بمشهد شهير من مسلسل (I Love Lucy) حين تباشر شخصية لوسي وظيفةً في مصنع للشوكولاته، وتحاول بلا جدوى أن تواكب سرعة حزام ناقل تمرّ عليه قطع الحلوى بسرعة فائقة. قالت تايلر: "عليك إيقاف الحزام الناقل".

عند الساعة 12:45 بعد منتصف الليل، وبناءً على طلب "أميركان إيرلاينز"، أصدرت إدارة الطيران الفيدرالية قراراً بوقف جميع رحلات الشركة التي لم تكن قد أقلعت. لكن سرعان ما تبيّن أن قرار وقف الطيران لم يكن سوى تأجيل للمحتوم، ففي نهاية المطاف، سيضطر المركز إلى التعامل مع تبعات إلغاء الرحلات.

تكره شركات الطيران إلغاء الرحلات، لا لما يسببه ذلك من استياء للمسافرين فحسب، بل أيضاً بسبب تبعاته الأخرى. إن إلغاء الرحلات لا يترك المسافرين وحدهم عالقين، بل أيضاً الطائرة وطاقمها الذي كان سيواصل رحلته إلى وجهات أخرى.

ولهذه الاضطرابات تبعات على امتداد شبكة الرحلات الجوية، كما أن لها تأثيرات غير مباشرة. فكثيراً ما تُستخدم الطائرات لنقل قطع الغيار والمستلزمات الأخرى إلى ورش الصيانة، ما يعني أنه إذا أُلغيت رحلة ما، فقد يتعطل إيصال قطع غيار تحتاجها طائرة أخرى في مطار ما.

آلية اتخاذ القرار قد تخفق أحياناً

مع ذلك، خلص قادة مركز العمليات المتكاملة المتواجدين على الجسر والذين كانوا ينسّقون مع فريق من مديري العمليات الاستثنائية، إلى أنه لا مفر من إلغاء الرحلات. (إضافة لذلك كله، كانت شركة الطيران تواجه عواصف رعدية في مطارها الرئيسي في شارلوت). كما الحال دائماً، سعى المخططون لتقليل الأضرار قدر الإمكان، حيث اختاروا أكبر عدد ممكن من الرحلات التي تقلع وتعود إلى المطار نفسه، وتأكدوا من وجود سعة كافية للبوابات في المطارات التي ستتوقف فيها مؤقتاً الرحلات الملغاة.

ألغت "أميركان إيرلاينز" 114 رحلة بين الساعة 4:00 و5:00 فجراً، وفي الساعة التي تلت ذلك، ألغت 148 رحلة أخرى. وبينما كانت الرحلات تُلغى، كان فريق من المتخصصين في تقنية المعلومات يتجهون نحو مركز العمليات المتكاملة. 

كان إصلاح الكمبيوترات بسيطاً، حيث يتطلب فقط إزالة الملف الذي يسبب المشكلة فيعود الكمبيوتر لسابق عهده. لكن كان يتعيّن فعل ذلك لكلّ جهاز على حدة، واحداً تلو آخر. بحلول منتصف النهار، كانت الشركة قد عادت إلى العمل بشكل شبه طبيعي، مع بعض التأخير في عدد من الرحلات. 

قالت سوزان ويليامسون، المديرة التنفيذية لمركز العمليات وهي تعمل تحت إدارة تايلر: "بحلول الساعة الثالثة من بعد الظهر، عاد أغلب شركائنا إلى العمل أيضاً". وفي اليوم التالي، 20 يوليو، عادت نسبة إتمام رحلات "أميركان إيرلاينز" إلى 98.9%.

لكن آلية اتخاذ القرارات قد لا تعمل دائماً بشكل مثالي. فشركة "دلتا" التي تمتلك على الأرجح أفضل سجّل تشغيلي في الولايات المتحدة خلال السنوات القليلة الماضية، قررت التريث حيال إلغاء عدد كبير من الرحلات في ساعات الصباح الأولى يوم 19 يوليو. وكانت نتيجة ذلك أنها واجهت مشاكل تتعلق بركاب عالقين وأمتعة مفقودة حتى بعد مرور أسبوع من العطل، واضطرت لأن تلغي 7000 رحلة. 

رفضت "دلتا" التعليق على تعاملها مع أزمة "كراود سترايك"، واستعاضت عن ذلك بالإشارة إلى تصريح سابق لرئيسها التنفيذي إيد باستيان نشرته صحيفة "وول ستريت جورنال" وقال فيه: "لم نرد أن نسرع نحو إلغاء الرحلات لأن الأوضاع كانت متقلبة حينئذ". 

رفعت "دلتا" لاحقاً دعوى قضائية ضد "كراود سترايك"، وقدرت كلفة الأزمة بنحو 500 مليون دولار، وأقامت "كراود سترايك" دعوى مضادة اتهمت فيها "دلتا" بمحاولة إلقاء اللوم عليها.

تحديث إدارة العمليات

تعمل "أميركان إيرلاينز" على تحديث إدارة عملياتها اليومية، سواء العادية أو الاستثنائية، بعناية. في بداية نوفمبر، أكملت ترقية نظام تخطيط الرحلات، وهو أداة برمجية مخصصة لموظفي الاتصال بالطيارين. كما تعمل منافساتها على ما يشابه ذلك. 

يستخدم أندرو ميدلاند، رئيس قسم الطيران في شركة "أوليفر وايمان" (Oliver Wyman) الاستشارية، تشبيهاً طبياً ليصف واقع قطاع الطيران قائلاً: "المريض على طاولة العمليات، العملية جارية، الأعضاء تُزرع، ولكن ما يزال هناك كثير من العمل"، وعلى عكس المرضى العاديين، هذا المريض مضطر للاستمرار بالعمل، حتى وهو تحت العملية.

كانت شركات الطيران، ومنها "أميركان إيرلاينز"، في طليعة مستخدمي الكمبيوتر لإدارة كافة العمليات، من إدارة مخزون قطع الغيار إلى الحجوزات ووصولاً إلى احتساب أنسب الأسعار.

ما تزال بعض تلك الأنظمة، التي كانت طليعية ذات يوم، مستخدمة حتى الآن، وتُشغل في بعض الحالات على أجهزة كمبيوتر مركزية عبر طبقات عديدة من أدوات برمجية أحدث.

إن هذا إرث اندماجات على مرّ عقود، وما يلي ذلك من عمليات تكامل تستغرق سنوات. يدلّ ذلك أيضاً إلى صعوبة إحداث تغيير في عملية بالغة الدقة مستندة إلى البشر، واستيعاب المعرفة التي تنطوي عليها.

قال سيمور، مدير العمليات في "أميركان إيرلاينز": "نحن نعمل شيئاً فشيئاً على ترقية هذه الأنظمة لأنها تضم كثيراً من التشابكات".

تصنيفات

قصص قد تهمك