Statistika u službi sporta – Predviđanje rezultata, odabir igrača, donošenje odluka

Ovom prilikom pišemo o tome kako statistika može biti od koristi u savremenom sportu.

Stefan Vujović - 15. Septembar, 2015.

Predviđanje rezultata

Prošle godine u Brazilu, održano je svetsko prvenstvo u fudbalu. To inače ne bi bilo preterano interesantno publici Startita, da se nije dogodilo sledeće: Google je tačno predvideo 14/16 mečeva na ovom prvenstvu, dok je Microsoft uspeo da predvidi 15/16 mečeva.

Google je čak učinio dostupnim svoju tehnologiju za predviđanje i postavio je na Github – IPython Soccer Predictions. Naravno, koristi li su Google Cloud Platform i Big Query a kao programski jezik odabrali su Python (alternativa im je bila R), a uz njega idu i Pandas biblioteka, IPython, SciPy i Scikit-Learn.

Kao izvor podataka koristili su Optu i svoje odluke su bazirali na mnoštvu podataka prikupljenih u prethodne dve sezone u Premier Ligi, Primeri i MLS-u, kao i na prethodna dva svetska prvenstva. Nešto više detalja o svemu možete videti na snimku ispod.

Ono što je očigledno je da se ovaj sistem može unaprediti i da njegova trenutna preciznost od oko 60% – 70% može biti veća.

Ovo ipak i nije toliko veliko iznenađenje uzevši u obzir da kladionice već godinama zasnivaju svoje poslovanje na primeni statističkih metoda i raširenih ruku primaju u svoje redove dobre poznavaoce statistike, neuronskih mreža, mašinskog učenja, analitike itd..

Moneyball – Revolucija u bejzbolu

Oakland Athletics je tim koji je pred pocetak sezone 2002. godine morao da se odrekne tri najbolja igrača i sastavi tim sa jednim od najmanjih budžeta u ligi (narandžastom bojom obeleženi na slici ispod). Ipak, menadžment kluba je uspeo da sastavi tim koji je te sezone ušao u plejof i postavi rekordan niz od 20 pobeda za redom, tako oborivši prethodni iz 1947. godine. Na taj način postali su prava sportska senzacija u Americi.

Plasman u plejof su ostvarili i u 2003. godini uz slične finansijske uslove.

Tajna njihovog uspeha bila je u potpuno novom pristupu kupovine igrača, koji se zasnivao pre svega na statistici. Danas, za ovo čak postoji izraz sabermetrics.  Njihove metode, obelodanjene su već 2003. godine u knjizi Moneyball na osnovu koje je 2011. godine snimljen istoimeni film (naravno, film je statistiku pokrio na prilicno apstraktnom nivou).

Uspešnost tima iz Oklanda je vremenom opadala, jer je sve više drugih timova počelo da primenjuje njihove metode i danas svi veliki bejzbol klubovi zapošljavaju sabermetrics analitičara.

Naravno, kasnije je pronađena primena statistike i u drugim sportovima popularnim u SAD-u, pre svega u takmičenjima kao što su NFL i NBA. Treba pomenuti da od ove sezone NFL igrači dobijaju RFID čipove.

Fudbalska analitika

“Moneyball” princip još uvek nije primenjen u fudbalu na pravi način, što i ne čudi, jer se dosta razlikuje od gore pomenutih sportova. Ipak i u fudbalu postoje statistike koje su slične kod svih dobrih igrača, što znači da je potreban drugačiji model i obraćanje pažnje na faktore koji su najbitniji za ovu igru. Potvrda ovoga je čuveni transfer Endija Kerola u Liverpul za 35 miliona funti 2011. godine koji je sproveo tadašnji direktor fudbalske strategije Damien Komoli koji je primenjivao metode poput onih u bejzbou. Kerol je na 44 utakmice postigao samo 6 golova. 

On je u obzir uzimao činjenicu da je Kerol najbolji konverter kornera u ligi, kao i da su Henderson i Downing izuzetno dobri u dodavanj lopte. Međutim, ključna greška se nalazi u tome da je korner zapravo vrlo mala pretnja za protivnika. Zašto? Verovatnoća da dođe do šuta na gol nakon kornera je 0,205, što je otprilike svaki peti korner, a od tih 5 šuteva samo 11% rezultuje u gol. Lako se dolazi do računice (0,205*0,11) da je konverzija kornera samo 0,022, odnosno, mizernih 2,2%.

Petar Čeh  je u finalu Lige Šampiona odbranio 3 od 6 penala i tako izuzetno uticao na pobedu njegovog tima i osvajanje trofeja. Nakon meča je izjavio da je dobro odradio domaći, tj. da je gledao protivničke igrače kako izvode penale i tako je uspeo da predvidi gde će oni šutirati. Penali su možda trenutno jedan od parametara koji najviše podležu matematičkim i statističkim pravilima. Ono što je zanimljivo je da je posmatranje golmana još bolja metoda, npr. Vladimir Stojković se najčešće baca u levu stranu kada brani penale.

Domaći teren je domaći teren, što potvrđuje i statistika. Prema istraživanjima, verovatnoća da tim postigne gol kada nastupa kao domaćin je duplo veća od one kada igra u gostima.

Ovo su bili osnovni primeri za donošenje tatičkih odluka, ali i prognozu mečeva. Ima ih mnogo i može se reći da se polako razvija “nauka” o svemu tome. Preskočio bih nabrajanje činjenica i uputio bih zainteresovane na literaturu. Knjige koje se mogu poistovetiti sa knjigom Lean Startup u preduzetničkom svetu su Soccernomics i The Numbers Game u svetu fudbala.

Možda još uvek nije moguće sastaviti ceo tim na osnovu brojeva, ali je definitivno moguće iskoristiti podatke za donošenje boljih odluka koje nisu zasnovane samo na intuiciji, kao i za bolji uvid u slabosti i snage svog i protivničkog tima.

Bayern i SAP

Minhenski Bajern već dugi niz godina (još od 2009. godine) zapošljava tim analitičara i može se reći da su u tom periodu povratili “staru slavu” igrajući čak tri puta u finalu lige šampiona. Kako ljudi iz Minhena nisu zadovoljni trenutno dostupnim podacima, napravili su partnerstvo sa SAP-om koji će im razviti sistem koji će obezbeđivati njima neophodne podatke za donošenje odluka.

Nemačka reprezentacija koja je aktuelni prvak sveta takođe koristi tehnologiju koju je razvio SAP:

Trenutno stanje: USA vs EU

U ovom trenutku većina klubova MSL-a zapošljava tim analitičara kako bi postigao optimalne rezultate, što i ne čudi s obzirom na gore pomenuti Moneyball i američki odnos prema sportu i biznisu. U Evropi priča nije toliko razvijena, trenutno klubove u večini slučajeva vode bivše klubske legende (mi najbolje znamo kako to izgleda) i na transfere igrača ne utiču samo njihove performanse, čak se dešava da klubovi potroše desetine miliona na igrače koji ne postignu ni prosečne rezultate (Liverpul se može koristiti kao primer za prethodnih nekoliko godina). Međutim, ove sezone 7 – 8 klubova Premier lige je zaposlilo analitičara, dok ih je prošle godine bilo 3-4, a nemci već godinama organizuju konferencije na kojima dele iskustva među klubovima.

Nedostatak podataka

Jedan od većih problema sa kojima su analitičari u ovom momentu suočeni je, iako možda na prvi pogled tako ne izgleda, nedostatak adekvatnih podataka. Kako je to moguće, kad danas svaki prenos uključuje mnogobrojne podatke? Pa, iz prostog razloga, mnogi podaci koje mediji prikazuju zapravo nisu od velikog značaja za donošenje odluka u fudbalu. Većina kompanija, pogotovo u prethodnom periodu prikupljala je podatke isključivo za potrebe medija. Međutim, gore pomenuta saradnja Bajerna i Sapa pokazuje da će se u budućnosti raditi na rešavanju problema.

Aktuelna pravila

Ono što analitičari takođe vide kao prepreku je komunikacija u toku meča. Analitićari su najčešće udaljeni na desetine i stotine metara od klupe na kojoj je stručni štab. Aktuelna pravila ne dozvoljavaju upotrebu mobilnog telefona ili drugog vida komunikacije. Stoga, sve informacije koje utiču na odluku trenera mogu da budu isporučene tek nakon prvog poluvremena.

*

Danas je statistika sve bitniji faktor u profesionalnom sportu. Uz razvoj tehnologije i prisustvo sve veće količine podataka, uz primenu statističkih metoda i mašinskog učenja mnogo toga se može zaključiti i predvideti. Oni koji sada ili u skorijem periodu ovladaju podacima, biće u značajnoj prednosti nad ostalim timovima.