Statistik Consulting
  • Home
  • Leistungen
    • Predictive Modeling
    • Kundensegmentierung
    • Forecast
    • Statistische Versuchsplanung
    • Räumliche Analysen
    • Statistik Kurs
    • R-Kurs
  • Blog
    • Forecast 100m Final London 2017
    • Forecast 100m Finale der Männer, Rio 2016
    • Gemeinderatswahl Wien 2015
  • Projekte
    • Kundensegmentierung für Finanzdienstleister
  • Kunden
  • Kontakt
  • Über uns
Statistik Consulting

GAM

Home / GAM
05Aug

Forecast 100m Final London 2017

05/08/2017 Johannes Hofrichter Forecast, Predictive Modeling 124

Forecast 100m Final Men

IAAF World Championships in London 2017, and again one big question is, who will be the fastest man on earth. It seems that there are the same protagonists as last year in Rio. Usain Bolt on his last big event and his challenger Justin Gatlin. The third man on the podium in Rio, Andre De Grasse, is injured, so there is place for new faces. One could be Christian Coleman who run to seasonal best this year, or Julian Forte with the fastest time in the heats. To get an impression who of the athletes have good chances to qualify for the final and which time they will run at the final, we take a closer look at the data (www.iaaf.org). For each athlete we analyzed his historical marks to predict his time for the final. Therefore we used machine learning methods for the prediction. Usually we use a smooth trend over time, wind speed during the competition and some indicator variables as explanatory variables. These indicator variables notice if the competition was a final or not and if it took place at a World Championships (WC) or Olympic Games.

Estimated Time for Usain Bolt

Let us take a look at Usain Bolts data. The yellow line represents an average smooth trend over time. The blue points are the time of the heats at WC or Olympic Games. Those are usually higher than the yellow average time. This indicates that he has not run at full speed in the heats as you can see at the last few meters when he turns his head and smiles to his challengers. The orange points reflect the time at the semi finals and are usually a little bit lower than the yellow average line. The golden points are the time of the finals and here it gets clear that at the finals he is considerably faster than usually. Therefore his predicted time for the final is 9.82, red point. The horizontal red lines represent a 95% prediction interval for this estimated time.

Prediction for Qualified Athletes

If we analyze the data from the other athletes in the same way, assumed that there is enough data available, we get a predicted time with a 95% prediction intervals for each athlete. These results are shown in the figure below. This figure shows that again Usain Bolt has the best precondition to win the final. Justin Gatlin seems to be his first persecutor and Christian Coleman and Yohan Blake will fight for the third place. Then there is a little gap followed by eight athletes (Ben Youssef Miete – Andrew Fisher) who have a good chance to qualify for the final. Then there is a second gap and all athletes with an estimated time slower than 10.06 will have to give their best to have a chance for the final.

Forecast after Semi Finals

Update: 5.8. 21:20

After the semi finals it looks like that Usain Bolt is again the favorite for gold but has a new young challenger, Christian Coleman. Justin Gatlin did not that good but the history shows, that he can push in the final for a better time. The fourth on the list for a medal is Yohan Blake. At 22.45 CET we will, see who will win gold at the IAFF World Championships at London 2017.

Read more
05Aug

Forecast 100m Finale der Männer, Rio 2016

05/08/2016 Johannes Hofrichter Forecast, Predictive Modeling 126

Am 14.8.2016 ist es wieder soweit. Das 100m Finale der Herrn wird bei den Olympischen Spielen in Rio über die Bühne gehen. Weltweit werden wieder Millionen Zuschauer diese Spektakel verfolgen und gespannt sein, wer aktuell der schnellste Mann der Welt ist. Schafft es Usain Bolt zum dritten mal olympisches Gold zu hohlen oder wird dieses mal einer seiner Kontrahenten der Gewinner sein? Auf Grund der Ergebnisse im heurigen Jahr scheint Justin Gatlin sein größter Konkurrent zu sein. Ein Blick auf die Historie der gelaufenen Zeiten dieser beiden Kontrahenten verrät, dass es diesmal sehr knapp werden wird. Wie knapp es werden wird, zeigt uns die folgend Analyse.

Um abzuschätzen welche Zeit diese beiden Kontrahenten im 100m Finale laufen werden, werden als Datenbasis die offiziell gemessenen Zeiten ab dem Jahr 2002 betrachtet. (Datenquelle: www.iaaf.org). Zur Verfügung stehen die gelaufene Zeit, der gemessene Wind, der Ort und das Datum. Es wurden nur jene Zeiten berücksichtigt, die im regulären Windkorridor von -2 m/sec bis 2 m/sec liegen. Für die Vorhersage der Zeit bei den Olympischen Spielen in Rio wurde der zeitliche Verlauf anhand einer nichtlinearen Funktion modelliert. Zusätzlich wurde überprüft welchen Einfluss der Wind hat und ob der Athlet bei Großveranstaltungen (Weltmeisterschaft und Olympische Spiele) im allgemeinen schneller oder langsamer läuft. Ebenfalls untersucht wurde ob er in einem Halbfinale oder Finale bei Großveranstaltungen schneller oder vielleicht auch langsamer als sonst läuft. Zwischen Weltmeisterschaft und Olympischen Spielen wurde nicht unterschieden.

Forecast 100m Finale für Usain Bolt

Betrachten wir als erstes die Zeiten von Usain Bolt. Die gelbe Line zeigt dabei die geschätzte mittlere Zeit über die Jahre hinweg. Es ist zu erkennen, dass diese leicht ansteigt und somit Usain Bolt über die Jahre im Mittel etwas langsamer wurde. Sehr auffällig ist, dass Usain Bolt im Finale bei Großereignissen deutlich schneller ist (goldene Punkte). Der rote Punkt stellt die vorhergesagte Zeit für das Finale bei den Olympischen Spielen in Rio 2016 dar. Diese beträgt 9.780 sec, obwohl seine durchschnittliche Zeit aktuell nur knapp unter 10 sec liegt. Die deutliche Korrektur nach unten ergibt sich daraus, dass Usain Bolt bei Großereignissen immer schneller läuft als seine aktuelle mittlere Zeit. Das zeigt auch die große Differenz zwischen den goldenen Punkten und der gelben Linie. Die rote Linie um den Punkt beschreiben die Unsicherheit dieser Vorhersage. Die gelaufene Zeit im Finale liegt mit einer Wahrscheinlichkeit von 95% in diesem Intervall.

usian_bolt_100_meters

Forecast 100m Finale für Justin Gatlin

Der Verlauf von Justin Gatlins Zeiten zeigt ein etwas anderes Bild. Hier ist zu erkennen, dass er nach seiner Pause im Mittel schneller wurde und sich in den letzten beiden Jahren konstant auf Niveau von knapp über 9.9 sec befindet. Auch Gatlin ist bei Großereignissen im Halbfinale und Finale konstant schneller, allerdings ist er nicht um so viel schneller wie Usain Bolt. Daher ist die vorhergesagte Zeit für Gatlin 9.785 sec also um 0.005 sec langsamer als bei Usain Bolt. In Österreich würde man im politischen Jargon sagen: „Das wird a….knapp“.

justin_gatlin_100_meters

Vergleich der Laufzeiten verschiedener Athleten

Es ist natürlich auch spannend, wie die anderen Teilnehmer bei den Olympischen Spielen in Rio performen werden. Da zum aktuellen Zeitpunkt noch nicht klar ist, wer denn alles ins Finale kommt, wurde die Analyse für jene Läufer gemacht, die in den letzten beiden Jahren eine Zeit unter 9.95 sec gelaufen sind. Für jeden einzelnen von diesen wurde eine Analyse durchgeführt, mit dem Ergebnis einer vorhergesagten Zeit für das Finale, sofern es erreicht wird. Die Analyse hat gezeigt, das nicht alle prinzipiell bei Halbfinale oder Finale signifikant schneller laufen als bei anderen Events. Teilweise ist die Anzahl der vorhandenen Zeiten relativ gering, so dass für die Vorhersage nur die mittlere gelaufene Zeit der letzten Jahre verwendet wurde. Die Grafik zeigt, dass Usain Bolt und Justin Gatlin sich deutlich von den anderen Läufern abheben. Die restlichen liegen hier sehr knapp beieinander.

forecast_100_meters_men_rio_2016

Fazit: 100m Finale

Sowohl das Rennen um die Goldmedaille als auch das um die Bronzemedaille wird knapp. Sofern beim Finale kein Wind geht liegt die vorhergesagte Siegerzeit im 100m finale bei den Olympischen spielen in Rio bei 9.78 sec. Die untere Grenze für die vorhergesagte Zeit ist bei Usain Bolt und Justin Gatlin bei 9.65 sec, damit ist es auch sehr unwahrscheinlich, dass ein neuer Weltrekord gelaufen wird.

Anmerkung: Einige Läufer haben bis jetzt noch bei keiner oder nur einer Großveranstaltung teilgenommen, bei diesen ist es nicht möglich abzuschätzen ob sie bei Großereignisse anders performen als sonst. Die Analyse hat gezeigt, dass dies unterschiedlich sein kann. Es gibt Läufer die beflügelt das und laufen schneller, andere sind gleich schnell, oder laufen sogar etwas langsamer.

Die Analyse wurden mit der Statistik software R for Statistical Computing durchgeführt. Grafiken wurden mit dem r-package ggplot2 erzeugt. Für die Analyse kamen die Modelle GAM, GLM zum Einsatz. Das Prediction Intervall wurden mittels nicht parametrischen Bootstrapverfahren berechnet.

Datenquelle: www.iaaf.org

Read more
12Okt

Gemeinderatswahl Wien 2015

12/10/2015 Johannes Hofrichter Visualisierung 119

Am 11.10.2015 fanden in Wien Gemeinderatswahlen statt und ich dachte mir, es ist Zeit für eine alternative Darstellung der Verteilung der Wählerstimmen: Weg vom Fleckerlteppich, hin zu einer räumliche glatten Verteilung. Die Grafiken zeigen den relativen Anteil der Wählerstimmen pro Partei bezogen auf die insgesamt abgegebenen Stimmen an. Die Sättigung der Farbe gibt die Höhe des Anteils an, je höher der Anteil, desto dunkler die Farbe.

Der Wahlkampf war ja stark vom Duell SPÖ gegen FPÖ geprägt. Dazu auch eine Grafik mit der Differenz der erreichten Prozentwerte. Rote Farbtöne zeigen Gebiete bei denen die SPÖ mehr Stimmen hat als die FPÖ, bei blauen Farbtönen ist das umgekehrt. Je dunkler die Farbtöne, desto größer ist der Unterschied. Auf Grund der Glättung über die Wahlsprengelgrenzen hinaus, kann es durchaus vorkommen, dass einzelne Wahlsprengel leicht rot sind, obwohl in diesen Wahlsprengel die FPÖ mehr Stimmen hat und auch umgekehrt.

Gemeinderatswahlen_Wien_2015_Diff_spoe_fpoe

Methode:

Der relative Anteil pro Wahlsprengel wurde anhand Generalisierter Additiver Modelle (GAM) räumlich geglättet. Die Stimmen der Wahlkarten wurden pro Bezirk auf den einzelne Wahlsprengel aufgeteilt. Schlüssel für diese Aufteilung war die Differenz der abgegebenen Stimmen von der Anzahl der Wahlberechtigten pro Wahlsprengel.

Bei der Differenz zwischen SPÖ und FPö wurde pro Wahlsprengel die Differenz zwischen diesen beiden Parteien als Basis für die Glättung herangezogen.

Datenquelle: https://www.wien.gv.at/politik/wahlen/grbv/2015/
Stand: 13.10.2015, 8:10
Software: R

Read more
Zum Ändern Ihrer Datenschutzeinstellung, z.B. Erteilung oder Widerruf von Einwilligungen, klicken Sie hier: Einstellungen