Laboratorij

Krekiranje nogometnog koda

O analitičkoj revoluciji, fejkanju statistike i Liverpoolovu situ i rešetu

U kolovozu 2001. sir Alex Ferguson je napravio potez koji će kasnije nazvati “jednom od najvećih pogrešaka” u svojoj karijeri.

Proučavajući statistiku svojih igrača i uspoređujući brojke s onima iz prethodnih sezona, legendarni menadžer Manchester Uniteda je primijetio da stoper Jaap Stam starta na loptu rjeđe nego inače; budući da se Nizozemac bio približio svojoj 30., pretpostavio je da je prošao svoj igrački zenit i odlučio ga je prodati u Lazio. Međutim, Stam je nakon toga odigrao još nekoliko sezona na vrlo visokoj razini i to je Fergusona natjeralo da prizna kako je pogriješio. Odnosno, da su ga prevarile brojke jer nije ih promatrao u odgovarajućem kontekstu: Stam je doista rjeđe startao, ali samo zato jer je rjeđe za time imao potrebu. Taj podatak nije značio da je postao lošiji, već upravo suprotno: postao je bolji u čitanju igre i suradnji sa suigračima.

U ovom primjeru — iz današnje perspektive sasvim banalnom, ali bilo je to znatno prije nego što je analitika uhvatila korijenje u nogometu — ogledaju se dva glavna problema s analitikom u nogometu.

Jedan je taj da, zbog vrlo fluidne i dinamične prirode nogometa, kontekst igra veću ulogu nego u drugim igrama s loptom i zato nas suhe brojke vrlo lako mogu navesti na posve krivi zaključak. Za drugi problem suvremena analitika još uvijek nije pronašla rješenje: radi se o tome da konvencionalna statistika mjeri događaje prilikom kojih je igrač u posjedu lopte ili u borbi za nju, time praktično ignorirajući sve ostalo — a nogomet je prije svega momčadska igra u kojoj su kretanje, sinkronizacija i geometrija linija preduvjeti da bi se one situacije s loptom uopće dogodile.

Da, nogomet i analitika nisu baš par koji bi se ‘spanđao’ na prvi pogled, a dio razloga za to nije u konzervativnoj tradiciji i uskogrudnosti protagonista nego spada u domenu objektivnih poteškoća.

Jedan od klubova koji koristi mogućnosti napredne analitike i predvodi revoluciju je upravo Liverpool, koji je uz pomoć analitike rasturio tržište

Bejzbol je bio prvi sport u koji je, već vrlo rano, prodrla statistika, a onda i suvremena analitika. Jednostavan dizajn igre, laka mjerljivost ishoda i obilje podataka stvorili su plodno tlo za razvoj kulture u kojoj su brojevi bili dio svakodnevice, čak i za obične gledatelje. Osim što je bio temelj za globalizaciju fantasyja, koji je iz zabave za nekoliko studenata postao ogromna industrija zabave, takav kulturološki okvir bio je odličan preduvjet za dolazak Billa Jamesa i Billyja Beana koji su kao glavni operativci momčadi pokrenuli analitičku revoluciju i pomoću tzv. Sabermetricsa iz temelja transformirali sport. Utjecaj na bejzbol bio je toliki da je Hollywood morao snimiti film s Bradom Pittom u glavnoj ulozi, a tzv. Moneyball pristup se od tada počeo širiti i na druge sportove, prije svega na košarku.

Iako kompleksnija od bejzbola, ona i dalje ima relativno malo “stupnjeva slobode” (čitaj: broj igrača) i velik broj varijabli (čitaj: standardnih statističkih kategorija) što olakšava kvalitativnu analizu. Osim toga, igra je ‘diskretna’, tj. napadi su ograničeni, izmjenjuju se i ima ih jako puno po utakmici, kao i šutova/koševa, što nam daje veću količinu informacija, feedbacka i pojednostavljuje detektiranje kauzalne veze, tj. odgovor na pitanje što prolazi/ne prolazi od isprobanih taktičkih zamisli. Nakon košarke na red je došao football. Iako taktički nevjerojatno kompleksan i s većim brojem stupnjeva slobode (11 protiv 11), ipak je izrazito ‘diskretan’ sport (akcija po akcija), jako shematiziran (svaka akcija kodificirana je u playbooku) i jednostavno se mjeri uspjeh pojedine akcije, bilo u jardima, bilo u novom setu pokušaja ili u poenima.

Nogomet, invazijski sport kao i football, nema tako jednostavnu vezu i tako snažnu korelaciju između količine osvojenog dijela terena i konačnog uspjeha. Osim toga, izrazito je ‘kontinuiran’ (akcije nisu ‘omeđene’ kao u košarci ili footballu), jako je fluidan i pomalo kaotičan jer nema toliko shematizacije. Što je najgore, utakmice imaju jako mali broj golova što otežava detekciju kauzalne veze i evaluaciju što funkcionira, a što ne.

Osim samog dizajna sporta koji nogomet čini izrazito kompleksnom domenom za analizu, glavni je problem dugo vremena bio nedostatak samih podataka. Taj problem je uspješno riješen u posljednjih pet do 10 godina; danas osim što imamo nekoliko kompanija s vojskom analitičara koji ručno bilježe svaki događaj na utakmici, imamo i visoko-sofisticirane optičke sustave za praćenje koji automatski izvlače podatke iz slike. Ista tehnologija koja se koristila za navođenje balističkih raketa danas se koristi za praćenje igrača i lopte, a igrači ipak ‘putuju’ nešto sporije, što stvari čini jednostavnijima.

Tehnologija je tako dovela do toga da danas na raspolaganju imamo jako puno podataka, a data science timovi polako počinju ‘krekirati’ nogometni kod.

U prošloj epizodi Laboratorija uveli smo vas u priču o xG, trenutno najpopularnijem (ne i najkorisnijem!) konceptu napredne nogometne analitike koji smo prethodno u praktičnom smislu već upoznali kroz naše analize, a u ovoj epizodi širimo priču i vodimo vas još dublje u svijet analitike koja sve više oblikuje sport i čini razliku između pobjednika i gubitnika.

Nakon razvoja xG modela stvorila se potreba za dodatnom modifikacijom i razvojem novog koncepta – xGOT (eXpected Goals On Target). Dok xG model izračunava vjerojatnost postizanja pogotka na temelju povijesnog postotka realizacije iz tisuća i tisuća ‘istih’ prilika, xGOT nadograđuje originalni model uzimajući u obzir kvalitetu egzekucije. Tako xG mjeri kvalitetu prilika koje ekipa stvara (pre-shot model), a xGOT nam govori što je ekipa, tj. igrač napravio sa spomenutim prilikama (post-shot model).

Zašto je ovo bitno? Uzimajući u obzir oba faktora, kvalitetu prilike i kvalitetu egzekucije, puno bolje možemo ocijeniti kvalitetu napadača nego gledajući samo njegov broj postignutih golova ili prosjek realizacije. A kad na kupovinu napadača planirate potrošiti desetine milijuna eura, onda vam je zlata vrijedan svaki takav detalj koji suhe brojke stavlja u kontekst.

Jedan od primjera vrhunskog realizatora je Eden Hazard; analizirajući kumulativne vrijednosti xG i xGOT (zbroj iz sezone u sezonu bez penala) možemo vidjeti Hazardovu nevjerojatnu sposobnost realizacije pomoću koje je u proteklih šest sezona u Premier ligi debelo nadmašio kvalitetu prilika u kojima se našao, točnije zabio je čak 57 golova iz prilika u kojima bi prosječan napadač zabio samo 22. Hazard je tako svojoj momčadi donio čak 35 ‘ekstra’ golova kroz šest sezona.

Kao što možemo proučavati učinak igrača u polju, tako pomoću xGOT možemo evaluirati i učinak vratara. Uspoređujući xGOT sa stvarnim brojem primljenih golova možemo vidjeti koliko je golova vratar spriječio, te na ovaj način možemo bolje razlučiti vratare koji konzistentno rade vrlo teške obrane i one čiji učinak je napuhan zbog udaraca niske kvalitete s kojima su se suočili.

U tom kontekstu zanimljivo je analizirati Davida de Geu, točnije, usporediti njegov učinak u sezonama 2017./2018. i 2018./2019. U prvoj je u čak 18 utakmica sačuvao praznu mrežu, primio je 28 golova, ali ako uzmemo u obzir kvalitetu udaraca (xGOT) trebao je primiti njih 40, što će reći da je spasio 12 golova i Unitedu donio jako puno bodova. Bila je to možda i najbolja sezona nekog vratara u proteklom desetljeću, ali De Gea nije uspio zadržati takav učinak u sljedećoj sezoni, a ni u aktualnoj ne izgleda obećavajuće.

Osim xG i xGOT modela razvijeni su modeli i za xA, tj. očekivane asistencije, jer često se događa da kvalitetna dodavanja ne budu pretvorena u gol, pa na ovaj način puno bolje mjerimo doprinos u dodavačkom segmentu igre. Također, dok nogometni ‘znalci’ ističu visoki postotak točnih dodavanja kao najvažniju metriku za vezne igrače, Ian Graham, Liverpoolov direktor analitike (inače teorijski fizičar), opsjednut je omjerom rizika i nagrade u kontekstu pas-igre i tvrdi da neki od najboljih dodavača lopte imaju ispodprosječan postotak uspješnosti dodavanja.

“Jednostavno je fejkati statistiku”, govori Graham, “tako da odigravate vrlo konzervativna dodavanja koja vašoj momčadi zapravo ne podižu vjerojatnost postizanja pogotka, ali izuzetno su teška dodavanja koja ‘probijaju’ obrambene linije i u sekundi izbacuju četvoricu ili petoricu suparničkih igrača iz igre. Netko tko može odigravati takva dodavanja sa 50-postotnom uspješnošću je veznjak svjetske klase“.

No, iako su xG, xGOT i xA jako dobri okviri za evaluaciju igre i učinka igrača postoji jedan problem — udarci i dodavanja koja su prethodila udarcima čine manje od jedan posto akcija igrača u nogometnoj utakmici. Dakle, iako se radi o vrlo korisnim modelima, oni se ipak bave jako malim segmentom nogometne igre. Ilustrirajmo to sljedećim primjerom:

Svakom tko je ijednom gledao nogomet prilično je jasno da je vrhunsko dodavanje Aymerica Laportea s centra iza zadnje linije obrane igralo ključnu ulogu u ovom golu. Ipak, u konvencionalnoj nogometnoj statistici zasluge pripadaju samo Leroyu Saneu (asistencija) i Gabrielu Jesusu (gol). Prethodni primjer ilustrira zašto su nam potrebne neke nove i još naprednije metrike za procjenu učinka igrača. Zapravo, što ako bismo mogli evaluirati i vrednovati sve aktivnosti igrača na lopti? I one koje nisu udarac ili neposredno prethode udarcu ili se čak događaju dalje od suparničkog gola?

U proteklih par mjeseci pojavilo se nekoliko zanimljivih pristupa koji pokušavaju dati odgovor na prethodna pitanja — VAEP (Valuing Actions by Estimating Probabilities) i PV+ (Possession Value) te xT (Expected Threat). Koja ideja je iza njih?

Općenito govoreći, većina aktivnosti/radnji u nogometnoj utakmici izvodi se s ciljem povećanja šanse za postizanjem gola ili smanjivanjem šanse za primanje. Slijedom toga, jedan od načina procjene utjecaja i kvalitete pojedine radnje je izračunavanje koliko spomenuta radnja mijenja vjerojatnost za gol. Ako bismo u svakom trenutku utakmice mogli računati vjerojatnost za postizanje gola s obzirom na situaciju na terenu (tzv. game state), onda utjecaj pojedine radnje možemo jednostavno izračunati tako da oduzmemo vjerojatnost za postizanje gola u situaciji nakon izvršene radnje (dribling, dodavanje, ubačaj, udarac…) i situaciji prije nje.

Upravo na ovaj način funkcionira VAEP, a pristup je najlakše ilustrirati primjerom. Kolona Pscores u tablici predstavlja vjerojatnost postizanja pogotka u tom trenutku u utakmici, dok kolona VALUE predstavlja vrijednost pojedine radnje. Tako, na primjer, dodavanje Lea Messija prema Sergiju Busquetsu (2) smanjuje vjerojatnost postizanja gola za Barcelonu s tri posto (0,03) na dva posto (0,02) i zbog toga ima negativnu vrijednost, tj. utjecaj od -0,01, što je i logično jer se radi o povratnoj lopti dalje od suparničkog gola. No, nakon što mu Busquets vraća loptu, Messi prolazi Marcela (+0.05) a zatim vraća na rub kaznenog prostora (+0.09), dok Arturo Vidal odrađuje ostatak i sretno zabija gol udarcem vrijednim +0,83.

Pomoću spomenutih pristupa puno bolje možemo mjeriti utjecaj igrača i kvalitetu individualnih radnji na lopti, odnosno dodavanjima, ubacivanjima, driblinzima itd. Treneri i skauti na ovaj način dobivaju puno precizniji uvid o doprinosu pojedinog igrača, na koji način se taj doprinos manifestira i odgovaraju li karakteristike igrača stilu igre momčadi. Tako, na primjer, netko može driblinzima dovoditi svoju momčad u bolje situacije i podizati vjerojatnost za postizanje gola, dok su nekom drugom forte passing igra kojom donosi vrijednost svojoj momčadi.

A osim zabijanja golova, važan segment igre za napadače je link-up igra koju na ovaj način možemo mjeriti.

Kao što možemo vidjeti, napredna nogometna analitika doživjela je veliki napredak u zadnjih nekoliko godina i sve više izlazi izvan okvira klasične nogometne statistike. Pomoću spomenutih metoda možemo egzaktno kvantificirati sposobnost i kvalitetu igrača za svaki tip radnje na lopti, što klubovima bitno olakšava pronalazak talenta, posebno onih koji se uklapaju u filozofiju i stil igre kluba.

Jedan od klubova koji koristi mogućnosti napredne analitike i predvodi revoluciju je upravo Liverpool. Priča je to vrijedna zasebne kolumne, pogotovo kad pogledate pojačanja zadnjih godina: Philippe Coutinho, Sadio Mane, Naby Keïta, Mohamed Salah, Fabinho, Virgil van Dijk, Alisson Becker. Liverpool nije s tim imenima ‘pogađao’ nego je znao — sva su ona prošla sito i rešeto analitičkog tima Iana Grahama. Liverpool je uz pomoć analitike jednostavno rasturio tržište.

Ovo je trenutak u kojem bih trebao zaključiti kolumnu, ali postoji jedan mali problem. Sve prethodno spomenuto su on-the-ball metrike i pristupi koji se bave evaluacijom radnji s loptom (dribling, dodavanje itd), ali prosječan nogometaš je u posjedu lopte manje od 60 sekundi po utakmici, što će reći da postoji još jedan ogroman, zapravo dominantan i poprilično ‘neistražen’ segment nogometne igre.

I možda danas Fergusonove kolege brojke neće zavesti i ostaviti slijepima pored zdravih očiju, ali na podešavanju dioptrije koja će pomoći da vidimo jasnije i dalje od same lopte tek se radi. U potragu za njom dat ćemo se u jednoj od sljedećih epizoda Laboratorija.

Pročitali ste sve besplatne članke ovaj mjesec.

Za neograničeno čitanje Telesporta i podršku istraživačkim serijalima, odaberite jedan od paketa.

Ovaj članak je dostupan samo pretplatnicima.

Za neograničeno čitanje Telesporta i podršku istraživačkim serijalima, odaberite jedan od paketa.

X

Podržite oslobođeni sportski teritorij.

Za pristup i neograničeno čitanje Telesporta odaberite jedan od paketa.