Ranking FIFA może nas zmylić i wprowadzić w nadmierny optymizm. Lepszym predyktorem wyników na mistrzostwach świata jest ranking ELO, w którym wypadamy wyraźnie słabej. Ale i tak nasze szanse na wyjście z grupy wyraźnie przekraczają 50 proc.
W SpotData i Bankier.pl zbudowaliśmy model ekonometryczny tłumaczący wyniki drużyn na mistrzostwach świata. Na jego podstawie oszacowaliśmy prawdopodobieństwo dojścia do kolejnych faz turnieju dla wszystkich drużyn. Model jest oparty na danych historycznych i zależnościach między wynikami drużyn a ich pozycją w rankingach FIFA i ELO, zmianami tych pozycji przed mundialami oraz niektórymi wskaźnikami makroekonomicznymi. Wskaźniki makroekonomiczne dodaliśmy trochę dla zabawy (i cały ranking jest zabawą), bo trudno uzasadnić ich wpływ na wynik, ale okazuje się, że niektóre z nich są statystycznie istotne – na przykład poziom bezrobocia okazuje się być istotnie skorelowany z wynikami na mistrzostwach świata (po uwzględnieniu miejsc w rankingach).
Wybór zmiennych do modeli dokonany został na podstawie maszynowego przeanalizowania wszystkich możliwych do stworzenia na podstawie zebranych danych modeli. Na poniższym wykresie widoczne jest prawdopodobieństwo uwzględnienia każdej ze zmiennej w modelu. Im dłuższy pasek tym więcej razy dana zmienna była wybierana. Na czerwono oznaczono zmienne wpływające negatywnie na prawdopodobieństwo wyjścia z grupy, na niebiesko z kolei te wpływające pozytywnie. Intrygujące pozostaje istotne znaczenie bezrobocia. Wyższy jego poziom, w wielkim uproszczeniu, może oznaczać, że państwo nie radzi sobie z uporządkowaniem problemów społecznych co przekłada się na negatywny wpływ na jakość gry reprezentacji narodowej. Dotyczy to szczególnie krajów o bardzo wysokiej, ponad 15 proc. stopie bezrobocie. Tylko 20 proc. reprezentacji z krajów o bezrobociu przynajmniej 15 proc. awansowało do fazy pucharowej, podczas gdy wśród krajów o niższym bezrobociu takich reprezentacji było aż 62 proc.
Dziś pokazujemy estymowane szanse wyjścia z grupy dla poszczególnych drużyn.
Szanse Polski na wyjście z grupy wynoszą 66 proc. Liderem jest Kolumbia z szansami na poziomie 73 proc. Natomiast Japonia i Senegal mają wyraźnie niższe szanse – odpowiednio 40 proc. i 21 proc. Jak należy interpretować te liczby? Tak, że historycznie odsetek drużyn, z podobnymi miejscami w rankingach i innymi cechami krajów, co Polska dziś, które wyszły z grupy, wynosił ok. 66 proc. I analogicznie dla innych krajów.
Dużym zaskoczeniem w wynikach modelu jest dobry wynik Japonii, która ma w nim wyższe szanse awansu niż Senegal. Jest to szacunek idący w przeciwnym kierunku niż notowania u bukmacherów, które dają wyraźnie wyższe szanse Senegalowi. I pewnie większość kibiców intuicyjnie też faworyzowałaby Senegal. Co jednak ciekawe, bardzo podobny wynik do naszego modelu osiągnął Goldman Sachs, który Senegalowi daje 20 proc. szans na wyjście z grupy, a Japonii 37 proc. Goldman stosował bardziej rozszerzoną metodologię od naszej, uwzględniającą też m.in. informacje na temat zawodników, ale wyniki w wielu przypadkach są zbliżone. Rzeczywistość pokaże, czy złożone modele z udziałem uczenia maszynowego, które stosował w tym przypadku amerykański bank, wypadną lepiej niż prostsze modele statystyczne.
Ważne dla zrozumienia szans Polski na awans jest rozróżnienie dwóch rankingów – FIFA i ELO. Ten pierwszy jest bardziej popularny, ale ten drugi lepiej wypada w modelu tłumaczącym osiągnięcia na mistrzostwach świata. Prosta korelacja między średnią pozycją w rankingu FIFA (w relacji do innych drużyn z grupy) rok przed mistrzostwami a wynikami na mistrzostwach wynosi ok. 0,7, natomiast w przypadku rankingu ELO jest to ok. 0,8. W tym pierwszym Polska ma doskonałą, ósmą pozycję, w tym drugim jesteśmy dopiero na 21. miejscu. W rankingu FIFA Polska wyraźnie wyprzedza Kolumbię, w rankingu ELO jest dokładnie odwrotnie. W naszych modelach ranking ELO waży więcej, dlatego wypadamy gorzej od Kolumbii. I ranking ELO powinien być dla Polski ostrzeżeniem – w nim zajmujemy słabszą pozycję niż przed mistrzostwami świata w Niemczech w 2006 roku, gdzie – jak każdy kibic pamięta – nasz wynik okazał się bardzo słaby.
Co istotne, niedoskonałości stosowanego do tej pory rankingu zauważyła sama FIFA, wobec czego po zakończeniu rosyjskiego mundialu dojdzie do zmiany sposobu jego obliczania – wykorzystany zostanie właśnie ranking ELO.
A jak wygląda sytuacja w innych grupach? Największe szanse na awans z grupy ma Brazylia – 96 proc. Później są Portugalia, Niemcy, Argentyna i Anglia z wynikami zbliżonymi do 85 proc. W naszym modelu wysoko wypada Rosja, ponieważ model pokazuje istotny wpływ efektu gospodarza turnieju na wyniki.
Szacunki dotyczące prawdopodobieństwa awansu do kolejnych faz turnieju opublikujemy wkrótce.
Reprezentacja | Prognoza SpotData/Bankier.pl | Prognoza Goldman Sachs | Różnica |
---|---|---|---|
Brazylia | 92,3% | 87,5% | 4,8% |
Portugalia | 85,1% | 75,2% | 9,9% |
Niemcy | 83,9% | 80,5% | 3,4% |
Argentyna | 83,4% | 79,7% | 3,7% |
Anglia | 83,4% | 73,1% | 10,3% |
Rosja | 77,5% | 47,9% | 29,6% |
Belgia | 77,4% | 78,5% | -1,1% |
Kolumbia | 73,1% | 74,9% | -1,8% |
Hiszpania | 72,7% | 72,3% | 0,4% |
Francja | 71,1% | 81,4% | -10,3% |
Urugwaj | 70,8% | 74,4% | -3,6% |
Polska | 65,9% | 68,5% | -2,6% |
Szwajcaria | 63,3% | 42,8% | 20,5% |
Islandia | 58,5% | 45,2% | 13,3% |
Peru | 55,2% | 37,3% | 17,9% |
Chorwacja | 49,1% | 49,8% | -0,7% |
Meksyk | 49,0% | 52,0% | -3,0% |
Dania | 46,5% | 47,8% | -1,3% |
Japonia | 39,6% | 36,5% | 3,1% |
Szwecja | 35,6% | 45,9% | -10,3% |
Korea Południowa | 31,5% | 21,6% | 9,9% |
Panama | 29,4% | 13,2% | 16,2% |
Egipt | 28,7% | 34,4% | -5,7% |
Iran | 28,4% | 35,4% | -7,0% |
Australia | 27,3% | 33,5% | -6,2% |
Kostaryka | 26,7% | 36,8% | -10,1% |
Arabia Saudyjska | 23,0% | 43,4% | -20,4% |
Senegal | 21,5% | 20,1% | 1,4% |
Serbia | 17,7% | 32,9% | -15,2% |
Maroko | 13,8% | 21,6% | -7,8% |
Tunezja | 9,8% | 35,2% | -25,4% |
Nigeria | 9,0% | 25,2% | -16,2% |