المحللون في مجموعة "غولدمان ساكس" فعلوها مجدداً، فها هم مرة أخرى يحاولون التنبؤ بنتائج مباريات كرة القدم ويفشلون.
طبعاً لا أرمي الاتهامات، إلا أن هذه المحاولات المتكررة التي تعكس شجاعة تحليلية، تُظهر لنا جميعاً العاملين في مجال البيانات، والمتلقين لها، أنه حتى بعد إثبات وجود عيوب في نموذج متطور وإعادة بنائه، يمكن للعالم الحقيقي أن يجعل منه أضحوكة من جديد.
توقعات كرة القدم
إن تكهنات "غولدمان" المتعلقة بكرة القدم ليست عملا سخيفا. فكثير من الأشخاص يجنون ثروات طائلة من النماذج المالية المعقدة في السوق.
كما أن نماذج الذكاء الصناعي تهزم البشر في شتى أشكال المنافسات، من البوكر إلى لعبة "غو".
وفي هذا الإطار، يصف "مايكل لويس" في كتابه: "كرة المال: فنّ الفوز في لعبة غير عادلة"، وفي الفيلم الرائع المقتبس عنه (Moneyball)، أسلوب التطبيق الناجح للنماذج الإحصائية في لعبة البيسبول.
لعبة الحظ
إلا أن كرة القدم لا تشبه أياً من هذه المنافسات، فهي أكثر فوضوية، ويصعب تأطيرها ضمن صيغة محددة.
إنها لعبة عشوائية، تكثر فيها الأخطاء، نادراً ما تُسجل فيها نتائج مذهلة، ويلعب الحظ فيها دوراً كبيراً، كلّها أمور تجعل كرة القدم أشبه بالحياة، وأعتقد أن هذا واحد من الأسرار خلف شعبيتها المتواصلة.
بالتالي، فيما يميل المزيد من الناس للثقة بالنماذج القائمة على البيانات التي تشهد تحسناً متواصلاً مع تطور التكنولوجيا، فعلى صعيد الحياة الحقيقية أو على الأقل ما يتعلق بالمساهمات الحيوية، كسياسات التعامل مع الجائحة على سبيل المثال، لا بدّ أن يعير البشر بعض الانتباه لتجربة "غولدمان" في توقع نتائج مباريات كرة القدم.
فبفضل المحللين الذين يقفون خلف هذه التوقعات، على رأسهم "سفن جاري ستيهن" الذي شارك في محاولات توقع النتائج في أعوام 2014 و2018 و2021، والمستعدين لأن يقرّوا بخطئهم علناً، وهو أمر لا يحبذه عادة المحللون ومعدو النماذج، يمكننا جميعنا أن نرى بأن التجارب والتحسينات في مجال الأدوات التكنولوجية ليست كافية بعد للتعامل مع نظام معقد فعلاً.
تحسين النماذج الإحصائية لم ينجح
سبق وكتبت عن التوقعات الخاطئة جداً في نماذج عاميْ 2014 و2018 على الرغم من تصميم المحللين على التعلم من أخطائهم وإضافة عوامل قد تكون أكثر أهمية إلى تحليلهم.
وقد ظهرت هذه الرغبة في التحسن بشكل واضح أيضاً في ورقة العمل التي تشرح النهج الذي تتبعه "غولدمان" في بطولة أوروبا 2020، البطولة القارية لكرة القدم التي أقيمت بعد عام من تاريخها المحدد بسبب جائحة كورونا.
فبعد أن توقع المحللون خطأ أن تفوز البرازيل بكأس العالم في عام 2018، وأن تصل مع ألمانيا إلى المباراة النهائية (في الواقع كانت المباراة النهائية بين فرنسا وكرواتيا، وانتهت بفوز فرنسا)، قرروا التوقف عن الاستناد إلى الإحصاءات على صعيد اللاعبين، والتركيز بدلاً منه على أداء الفرق وتصنيفها، خاصة أن ذلك ينسجم بشكل كبير مع المؤشرات على مستوى اللاعبين، مثل قيمة الانتقالات.
وبدل توقع احتمالات الفوز، يحاول النموذج بنسخته الحالية توقع عدد الأهداف التي يمكن أن يسجلها كل فريق في مرمى الخصم.
ذلك أشبه بنهج "كرة المال" الذي يقوم على التركيز على الإحصائيات الرئيسية لتحقيق النجاح.
[object Promise]بالتالي، فإن النموذج الحالي يبني على التجارب الماضية، ويستخلص من الإحصائيات الكثيرة التي يمكن تحليلها في مجال كرة القدم، من أجل تحديد المقاييس التي تعتبر الأفضل في تنبؤ النتيجة النهائية.
مع ذلك، أثبتت الأيام الأولى من البطولة أن النهج الجديد ليس أفضل من السابق.
النتائج تخالف أغلب التوقعات
ليس من العدل أن نطلب من مجموعة "غولدمان ساكس" أن تصيب في توقع النتائج الفعلية.
ولكن من أصل 12 مباراة، أصابت في نتيجة خمسة فقط، بالتالي فإن دقة توقعاتها أدنى حتى من تقليب العملة المعدنية عدة مرات.
إلى ذلك، لا يجوز أن نعزي هذا الفشل الذريع في التوقعات إلى أحداث عشوائية مثل السقوط المفاجئ للنجم الدانماركي "كريستيان أريكسون" في المباراة ضد فنلندا.
صحيح أن توقف قلب "أريكسون" الذي نجا من الموت، ربما كلّف رفاقه المفجوعين مباراتهم مع فنلندا، حيث أن سِجل الدانمارك كان يرجح فوزها.
إلا أن المباريات الأخرى لم يتخللها مثل هذه الأحداث، حتى أن معدل الأحداث العشوائية فيها كان عادياً.
لا بل ربما ساعدت العشوائية "غولدمان" كي تصيب ببعض النتائج. مثلاً، بدا أن المجر قد تتمكن من تحقيق تعادل في لقائها مع البرتغال الذي أقيم في بودابست أمام مدرّج ممتلئ، لتعود وتنهار تماماً في العشر دقائق الأخيرة من المباراة، وتخسر بفارق أكبر ممّا كانت تُنبئ به الدقائق الثمانين الأولى.
المبالغة في تأثير عامل الأرض
قبل المباراة التي جمعت بين ألمانيا وفرنسا في ميونخ، أقرّ "ستيهن" أن النموذج الذي يعتمدونه ربما يبالغ في تقدير تأثير عامل الأرض.
وقال ستيهن: "كألماني، آمل أن يعود عامل الأرض ليشكل فارقاً". بالطبع، خسرت ألمانيا المباراة على أرضها، ما شكّل تحدياً آخر لتوقعات "غولدمان".
فالاعب "ماتسهاملز"، في صفوف بطل العالم لعام 2014، سجل هدفاً في مرمى فريقه، هادياً الفوز إلى فرنسا.
أرني نموذجاً كان ليتوقع أمراً مماثلاً. مع ذلك، من الواضح أن فرنسا كانت الفريق الأفضل في المباراة، حيث سجلت هدفين تم إلغاءهما بسبب التسلل، إلا أنهما أثبتا أن بطل العالم الحالي كان الأفضل من ناحية السرعة والابتكار.
بلجيكا تفوز بالمسابقة!
بناء على كلّ ما تقدم، لا أعرف كيف يجب أن أنظر إلى توقع "غولدمان" بأن تفوز بلجيكا، المصنفة أولى حالياً، بالبطولة، وأن تهزم البرتغال في المباراة النهائية.
الرهان على المنافس الأقوى عادة ما يكون أكثر أماناً من اختيار فريق دخيل، ولكن أولاً، لا نحتاج إلى نموذج توقعات معقد من أجل التوصل لمثل هذا القرار، وثانياً، يبدو أن "غولدمان" وانطلاقاً من تجاربها السابقة في نماذج كرة القدم، لم تتوصل بعد إلى تحديد المجموعة الصحيحة من نقاط البيانات التي يجب أن تعتمدها في نموذجها.
في عالمنا المهووس بالبيانات، حيث أدوات القياس تشهد تحسناً متواصلاً، يمكننا أن نطَّلع على شتى أنواع الإحصائيات مباشرة أثناء مباراة كرة القدم. فالاتحاد الأوروبي لكرة القدم يقدم كماً هائلاً من الإحصاءات على صعيد الفريق وعلى صعيد الأفراد. وسيكون من المثير أن نقارن في نهاية البطولة هذه الإحصاءات بالنتائج النهائية.
مع ذلك، حتى الإحصاءات البديهية قد تتعارض بشكل كبير مع نتيجة المباراة. مثلاً، بلغت نسبة احتفاظ إسبانيا بالكرة 86% من الوقت في مباراتها ضد السويد، وقام لاعبوها بـ917 تمريرة بنسبة دقة بلغت 90%، مقابل 162 تمريرة فقط للخصم وبدقة 54%. والنتيجة؟ التعادل صفر لصفر.
صعوبة التوقع بعيد الأمد
في لعبة تتميز فيها كل مباراة بطابعها الفردي، بفضل مزيجٍ خاص من العوامل، وحيث تجتمع أحداث عشوائية، مع أخرى متعمدة، وتتصادم مزاجات عشرات اللاعبين ومحاولات المدربين لفرض النظام وسط هذه الفوضى، يمكن مع ذلك للانتظام الإحصائي أن ينجح على المدى البعيد.
إلا أن البطولات هي في الواقع فعاليات قصيرة الأمد، وتعتمد نتائجها على هذه المباريات الفردية أكثر من التوجهات بعيدة الأمد. بالتالي، فإن اختيار البيانات المناسبة صعب جداً، وربما يكون عديم الجدوى.
كن على استعداد للأسوأ
ولكن الحياة كذلك أيضاً. يمكن إعداد نماذج للحد من انتشار العدوى في ذروة تفشي جائحة كورونا، استناداً إلى الموجة الوبائية الأولى أو الأوبئة السابقة، إلا أن هذه المحاولات غالباً ما تصطدم بتحورات فيروسية جديدة، أو عدم الدقة في توقع مواعيد تسليم اللقاحات، وبمسار حملات التلقيح، والتجاوب المتفاوت مع قيود التباعد الاجتماعي، وكل الأنواع الأخرى من "البجعة السوداء" التي قد تخطر على البال.
من الصعب جداً أن اسمي خبيراً، توقع بدقة التغيرات في مسار الوباء، والحكمة الوحيدة التي يمكن أن استخلصها من مراقبتي لمحاولات إعداد السياسات انطلاقاً من البيانات، هي أنه يجب أن تكون "مستعداً دائماً للأسوأ".
وهذه نصيحة لا يتجاوز تأثيرها نصيحة "الرهان على الفريق الأعلى تصنيفاً".
النمذجة فعل قد تُشعرنا نحن الذين نمارسها أننا أذكى من الآخرين. كما أننا نميل لرفض الانصياع إلى الوقائع على الأرض، في حال بدأت فجأة تتعارض مع النموذج الذي وضعناه، إذ نرى أن بإمكاننا دائماً أن ننتظر أفقاً بعيداً بما يكفي.
لذا أنا ممتن جداً للمحللين رفيعي الكفاءة لدى "غولدمان" المستعدين لجعل أنفسهم أضحوكة مع نماذج كرة القدم التي يطرحونها: فهذه صفعة يحتاجها "عصر المعلومات" بشكل منتظم أكثر حتى من الفعاليات الرياضية الضخمة التي لا تصيب التوقعات حول نتائجها.