Laboratorij

Što su, dakle, ‘očekivani golovi’?

Sve što ste željeli znati o xG a niste imali koga pitati

Pojam očekivanih golova, a nakon njega i očekivanih bodova polako se prikrao u rječnike i onih najpoznatijih nogometnih analitičara, te je time ušao kroz vrata mainstream medija. Koristili smo ga i u Laboratoriju u nekoliko navrata, ali najviše u analizi Hajduka pod Damirom Burićem, ali nikad se nismo dublje dotaknuli te napredne statistike. Koje su mane, a koje vrline, te koji su idući koraci za parametar očekivanih golova — to su samo neke od tema kojih ćemo se dotaknuti da bismo ga približili našoj publici.

Za početak, očekivani golovi (xG) su mjera kvalitete neke prilike, odnosno udarca koji napadač uputi prema suparničkom golu.

U svom najosnovnijem obliku ona postoji otkad postoji i nogomet, jer svatko od gledatelja nakon odgledane akcije više ili manje uspješno procijeni koliko izgledna je bila koja šansa. Statističke kuće taj su osjećaj pretvorile u točne brojke, uzimajući sezone i sezone podataka da bi provjerili kolika je vjerojatnost da se pod određenim uvjetima s određene pozicije postigne pogodak. Analizirane su stotine tisuća udaraca i njihov konačan ishod da bismo dobili postotak onih koji su završili pogotkom, te su se time postavili osnovni parametri preko kojih današnji xG modeli funkcioniraju.

Generalno gledajući, funkcionira kako je prikazano na slici iznad, ali najevidentiniji primjer su kazneni udarci. Povijesno gledajući, tek svaki četvrti kazneni udarac ne završi pogotkom, što za ovaj model znači da postoji otprilike 75 posto šanse da će se on zabiti — prevedeno u očekivane golove, to znači da svaki kazneni udarac ima vrijednost 0,75. Ono što je važno je činjenica da na tu brojku ne utječe podatak o tome tko izvodi kazneni udarac, ni tko ga brani, što je u jednu ruku i poanta samog parametra. Ne prilagođava se ovisno o pucačkoj kvaliteti i sposobnosti napadača koji upućuje udarac, baš zbog toga da bi se moglo vidjeti koliko će napadač biti iznad ili ispod prosječnog očekivanja. Raznim prilagodbama ovisnim o igraču bi se unio bias u samu brojku, te bi se napravilo više štete nego koristi.

Stoga, slobodni udarac sa 20 metara imat će jednaku xG vrijednost bilo da ga puca Lionel Messi ili autor ovog teksta, ali kada bi se nakon nekog uzorka udaraca povadili golovi i usporedili s brojem očekivanih golova, jasno bi se moglo zaključiti da je jedan elitni izvođač prekida, dok je drugi ćelava prevara. Dalje, preko xG vrijednosti računaju se i definiraju ‘velike prilike’, a možda će vas iznenaditi to da modeli kao veliku priliku računaju sve udarce koji imaju tek preko 15 posto šanse da završe pogotkom (ta brojka varira ovisno o modelu). Što je svakako dobra informacija za sve nas koji često izgovaramo frazu: “100-postotna šansa”.

Liverpool je u Premier ligi trenutno gotovo 15 bodova ispred onoga što se očekivalo

Skok u svojoj popularnosti model očekivanih golova doživio je analizom pada Borussije Dortmund pod Jürgenom Kloppom koju je na StatsBombu napisao Colin Trainor. Neobjašnjivi pad na 17. mjesto Bundeslige kluba koji je četiri sezone prije toga bio dvaput prvak i dvaput doprvak analizirao je upotrebom vlastitog modela očekivanih golova. Model je pokazivao da je Borussia Dortmund trebala u tom trenutku biti na gol razlici +8, dok je u stvarnosti bila na -8. Takav swing značio je da, iako je momčad ‘trebala’ osvojiti 30 bodova (točnije, 29,6), osvojila su točno upola manje (15) — odnosno, Borussia nije trebala biti u zoni direktnog ispadanja, već je prema rezultatima modela trebali zauzimati četvrto mjesto prvenstvene ljestvice.

Ujedno se tada prvi put počelo govoriti i o tome može li se, barem u nekom dijelu, ‘izmjeriti sreća’ — tj. u ovom slučaju nedostatak iste, budući da su u završnicama akcija podbacili svi igrači.

Ako govorimo o prednostima korištenja xG modela, jedna od najkorisnijih stvari je svakako upotreba da bi se ocijenio golgeterski učinak napadača. Generalno, ako je napadač zabio više golova nego što je prema modelu bilo očekivano iz njegovih udaraca, govorimo o overachievementu. U suprotnom, kad je xG vrijednost viša od broja golova, govorimo o underachievementu. No, pošto se pokazalo da xG puno bolje od ostalih napadačkih statističkih parametara predviđa koliko će ekipa ili igrač zabijati, jedna sezona ispod očekivanja ne mora nužno biti pokazatelj loših stvari.

Visoka brojka očekivanih golova može se dobiti na dva načina — visokom frekvencijom udaraca ili ulaskom u odlične prilike za postizanje gola. Tako je, primjerice, u skautingu visok xG, a relativno maleni broj udaraca dobar signal da se igrač prilično dobro kreće ispred gola i da dolazi u dobre šanse, ali potrebno je i utvrditi koji su razlozi silnih promašaja. Zbog toga, xG modeli nisu zamišljeni samo da bi bili mjera kvalitete završnice. Postoje pokazatelji da je završnica (završni udarac prema golu) puno manje pouzdana i konstantna nego što je dobro kretanje i dolazak u izgledne pozicije ispred suparničkih vrata, pa se sve češće pozitivno gleda na visoku xG vrijednost, bez obzira na broj postignutih golova.

S druge strane, modeli imaju i niz mana.

Za početak, da bi se nešto valoriziralo kao prilika, te da se pripiše vjerojatnost postizanja pogotka, igrač mora uputiti udarac prema golu. To znači da u slučaju da se, na primjer, netko predugo namješta na udarac prije kojeg mu je lopta izbijena bez da ju je uputio prema golu, to neće biti uključeno u proračun. Tog problema uhvatila se ekipa iz SciSportsa (Nizozemska) i Leuvena (Belgija) u svom znanstvenom radu kojim je pokušala vrednovati sve napadačke akcije računajući vjerojatnost za postizanje gola nakon svakog poteza. Došlo se do zanimljivih podataka o tome tko svojim potezima dodaje najviše vrijednosti svojoj ekipi i napravljen je korak naprijed u dobivanju kompletnije slike o vjerojatnosti postizanja gola neovisno o tome uputi li se udarac ili ne.

Na ovo se nastavlja slučaj kada netko uputi dva ili više udarca prema golu unutar iste sekvence. Svaki udarac se računa kao zasebna akcija, pa se može dogoditi da vrijednost xG bude preko 1,00. Primjerice, vratar može obraniti kazneni udarac, odbiti loptu do pucača koji iz drugog pokušaja zabija i daje svojoj ekipi jedan pogodak u rezultatskom smislu, ali ta sekvenca se prema očekivanom broju golova računa s minimalno 1,20. To u konačnici jako utječe na xG između ekipa te daje krivu sliku o mogućim golovima s te utakmice, što je jedan od razloga zbog kojih se generalno ne preporučuje upotreba očekivanih golova na osnovi jedne utakmice ili sličnog malog uzorka za neku egzaktnu analizu.

Drugi jasan problem je nekonzistentnost između modela. Jednako kao što će za istu utakmicu podaci biti različiti kod Opte, InStata, WyScouta ili nekog četvrtog providera statistike, tako će se baratati i sa drugačijim vrijednostima kod različitih izvora za udarce koji su upućeni s iste pozicije. Svatko ima svoju bazu iz koje vadi povijesne podatke, ali i svatko ima svoju vlastitu formulu i uvjete pri udarcu koji ulaze u nju i koji su strogo čuvana tajna, a postoji niz potencijalnih defekata.

Prema podacima dostupnim na Understatu ekipa koja je najviše overachievala u odnosu na ono što su joj očekivani bodovi predviđali unutar posljednjih pet sezona bila je francuska Nica 2017. pod vodstvom Luciena Favrea.

Često bi se nakon takvog uspjeha moglo pričati o ogromnom utjecaju sreće, ali činjenica je da Favreove ekipe prilično konstantno uspijevaju prebaciti očekivanja. Točnije, u sezonama 2011./12., 2012./13. i 2013./14. triput zaredom je uspio pobijediti model očekivanih golova — kako za postignute, tako i za primljene pogotke. U svakoj od te tri sezone za preko 20 posto je nadmašio očekivane primljene golove (xGA), a da bi se njegov uspjeh stavio u kontekst dovoljno je napomenuti kako su od 2011. do 2014. izuzev njegove Borussije Möchengladbach još samo tri ekipe uspjele u tom pothvatu u ligama Petice (Sunderland 2013., Man City 2011. i Levante 2014.).

To je bio jasan signal da se ne radi o pukoj sreći, već da je Favre pronašao način da ‘prevari’ sve modele očekivanih golova, a samim time je potaknuo mnoge da analiziraju podatke i otkriju u čemu je kvaka. Nakon brojnih istraživanja naposlijetku se došlo do podatka da njegove ekipe uzimaju iznimno efikasne šutove, a iste takve maksimalno suzbijaju, ali na način koji dotadašnji modeli nisu evidentirali i penalizirali. Pokazalo se da je, primjerice, njegova Nica pucala na suparnički gol u situacijama gdje su u prosjeku 2,27 suparnička igrača između lopte i vrata (golman ne ulazi u to) — najmanje u cijeloj ligi. Možete već pretpostaviti da je situacija bila zrcalna u obrani, gdje je Nica prilikom udaraca između lopte i vlastitog gola naguravala više igrača od bilo koje druge ekipe u ligi.

Naravno, to je značilo da je otkrivena velika mana tadašnjih modela očekivanih golova — u proračun ne ulazi defenzivni pritisak prilikom udarca. U određenoj mjeri, to objašnjava i situaciju u kojoj se trenutno nalazi Liverpool, koji je u Premier ligi prema Understatovom modelu gotovo 15 bodova ispred onoga što se očekivalo prema golovima. Dio toga sigurno otpada na sreću, ali mora se reći i na obranu koja se predvođena Virgilom van Dijkom gotovo religiozno trudi ostati ispred lopte, pogotovo u situacijama jedan-na-jedan ne ostavljajući otvoren prostor iza sebe, te na brutalno efikasne golgetere koji već par sezona redovito nadmašuju model očekivanih golova. No, bez obzira na to, za pretpostaviti je da se ovakav trend neće nastaviti tijekom cijele sezone.

Potpuno je jasno kako je toliko velika mana nešto što se promptno krenulo rješavati, barem u profesionalnim modelima očekivanih golova. Kompanija Opta je lansirala parametre Shot Clarity i Shot Pressure u produkciju svojih modela koji bi u proračun trebali uzimati kvantitetu obrambenih igrača ispred lopte te samu blizinu i pritisak koji se vrši na pucača, ali to je više-manje ostalo pokriveno veom tajni.

Ono što je bilo otkriveno javnosti (iako ne baš sama formula i algoritam računanja) bio je StatsBombov Freeze Frame. Već ranije, u fazi testiranja svog modela su u kompaniji dolazili do pokazatelja da postoji još dosta prostora za poboljšavanje izračuna, a ovim dodatakom na svoj model su, osim ranije spomenutih stvari, počeli u kalkulacije ubacivati i druge detalje, poput pozicije vratara. Sve to dovelo je do naočigled točnijeg proračuna vrijednosti očekivanog gola, što su u prezentaciji pokazali preko ovog pogotka Harryja Kanea.

Taj njegov pogodak za povećanje vodstva na 2:0 protiv Southamptona inicijalni model je vrednovao sa 68 posto šanse da će završiti pogotkom, što je suludo malo s obzirom na to kakva je situacija na terenu. Novi model, uzevši sve nove faktore u proračun, dao je vjerojatnost od puno realnijih 94 posto da će Kane to pospremiti u gol. Usporedbe radi, Understatov model, čiji su rezultati za lige Petice dostupni svima nama, dao je ovoj situaciji 67 posto šanse — prilično slično kao prva verzija StatsBomba.

Jasno je da sličnih koraka u unaprjeđivanju modela zasigurno ima, te će se modeli s godinama i daljnjim razvojem sve više usavršavati, ali iznimno je pozitivno da šira javnost to vidi kao pozitivnu pojavu i da se sve češće koriste u analizama. Nogomet je dugo godina zaostajao za sportovima popularnima u SAD-u i njihovom analitikom, ali zbog svoje globalne popularnosti i veličine sposoban je u puno kraćem periodu barem ih sustići, ako već neće prestići.

Model očekivanih golova tek je početak.

Pročitali ste sve besplatne članke ovaj mjesec.

Za neograničeno čitanje Telesporta i podršku istraživačkim serijalima, odaberite jedan od paketa.

Ovaj članak je dostupan samo pretplatnicima.

Za neograničeno čitanje Telesporta i podršku istraživačkim serijalima, odaberite jedan od paketa.

X

Podržite oslobođeni sportski teritorij.

Za pristup i neograničeno čitanje Telesporta odaberite jedan od paketa.