Gjatë ndeshjes Meksikë-Holandë, tek dëgjoja komentatorin që numëronte sa herë kish ndodhur, në historinë e Kampionateve Botërore, që Holanda të barazonte ose të fitonte, pasi kish pësuar gol e para, m’u kujtua një shënim që e gjen rëndom në prospektet dhe reklamat e fondeve të investimeve: past performance is not an indication of future results.
Në fakt, premisa fund e krye e gabuar e këtyre statistikave futbollistike të kudogjendura është e kundërta e formulës së mësipërme – meqë komentatorët po na kërkojnë të besojmë se rezultatet në të shkuarën mund, madje duhet të shërbejnë si bazë, për të parashikuar rezultatet e tanishme; a thua se edhe rastësia mund të krijojë një reputacion të vetin.
Por “ekspertët” e sistemeve të fatit kanë edhe një metodë tjetër, për të parashikuar të ardhmen, në bazë të rezultateve të shkuara; të cilën e sheh të zbatuar, sa herë që lexon se 42-shi ka disa vjet që nuk ka dalë në numrat e lotos, ose kur dëgjon dikë të argumentojë se edhe numrat e rastësishëm do të shpërndahen “barabar”. Mjaft të vizitosh ndonjë nga uebsajtet e shumta, që u kushtohen parashikimeve të lotarisë ose të lotto-s (p.sh. programi Lotto 2.1, nga Stonito Software, premton ta ndihmojë përdoruesin, për të gjetur një “logjikë” në sekuencat e numrave të tërhequr). Kjo nuk ka lidhje, megjithatë, me vështirësinë e mirënjohur për të përftuar numra vërtet të rastësishëm.
Të përfytyrojmë një situatë kur hedhim një zar 4 herë, dhe të katër herët na bie gjashta, dhe të pyesim sa është probabiliteti që edhe herën e 5-të bjerë sërish gjashta. Me sa mbaj mend, këtë situatë e analizon Nassim Nicholas Taleb, në një prej librave të vet; duke vërejtur se shumë njerëz do të vinin bast që gjashta nuk bie më (meqë i ka “konsumuar” shanset e veta), ndërsa bixhosçiu ekspert do të vinte bast për gjashtën sërish, duke marrë parasysh mundësinë, sado të vogël, që zaret të jenë të trukuara. Në fakt, sikur të hedhim një zar një milion herë, diferencat në rezultat për numrat e ndryshëm thjesht do të pasqyrojnë asimetritë fizike të zarit, në kuptimin që do të shërbejnë kryesisht për të testuar vetë zarin, si vegël probabilitare.
Kjo situatë ndryshon nga ajo tjetra, kur tërheqim letra nga një stivë 52-letrash dhe mundohemi të marrim me mend se sa do të jetë probabiliteti që letra e radhës të jetë maç. Në qoftë se e kthejmë letrën në stivë dhe pastaj i përziejmë letrat pas çdo tërheqjeje, probabiliteti mbetet i njëjtë çdo herë: 1/13, pavarësisht se çfarë kemi tërhequr tashmë. Përkundrazi, në qoftë se letrën e tërhequr e mbajmë në dorë, probabiliteti ndryshon pas çdo tërheqjeje: kështu, nëse tërheqim një spathi, atëherë probabiliteti që letra e ardhshme të jetë maç do të jetë 13/51; dhe nëse pastaj tërheqim një kupë, probabiliteti që letra e ardhshme të jetë maç do të jetë 13/50 e kështu me radhë.
Gjithsesi, sado të kundërta të jenë interpretimet e të dhënave, si në dy shembujt e mësipërm nga futbolli dhe pastaj nga loja me zare, gabimi ka të bëjë drejtpërdrejt me premisën; ose me idenë se mund të përdoret e shkuara për të marrë me mend të ardhmen – si model pozitiv apo negativ qoftë.
Një gabim të ngjashëm ka bërë edhe Carl Sagan, në romanin e tij të mirënjohur Cosmos; ku hedh idenë se në vargun e pafund të shifrave dhjetore, të numrit transhendental pi, është e fshehur vetë figura gjeometrike e rrethit të prerë nga një diametër, çka të bën të mendosh për një “inteligjencë” në themel të universit. Siç e kanë vënë në dukje tashmë, një nga karakteristikat e pjesës dhjetore të një numri transhendental është se shifrat aty janë të shpërndara rastësishëm; dhe kjo do të thotë edhe se, po të kesh durim dhe të kërkosh në pafundësi, do të gjesh atje gjithçka: jo vetëm figurën gjeometrike të rrethit të prerë nga një diametër, por edhe emrin e vetë Carl Sagan-it, edhe tekstin e dixhitalizuar të romanit Cosmos, madje edhe skenarin e filmit përkatës.
Në fakt, rastësia nuk e përjashton domethënien; unë vërtet nuk kam pasur rastin të qëmtoj konfigurimet e shifrave dhjetore të pi-së (dhe as do ta kem), por kam qenë i pranishëm në një lojë peskatëshi në plazh, kur dikujt i erdhën në dorë, pas ndarjes së letrave, 13 kupa. E kotë të shtoj se asnjë ndarje letrash e deriatëhershme nuk kish paralajmëruar, në ndonjë farë mënyre, për afrimin e kësaj “mrekullie” në miniaturë!
Shënim: sa më lart është thjesht një bisedë që dua të hap, jo përpjekje e fshehtë imja për t’u doktoruar në shkencat probabilitare. Miqësisht i ftoj specialistët e fushës që të ndihmojnë me argumentimet e tyre më të sakta.
Gabimi qe behet ne perdorimin e statistikave ne futboll eshte i dyfishte. E para variablet e rastesishme nuk jane te njejta. Nese nje ekip nacional fiton me nje ekip tjeter para 10 ose 100 vitesh nuk mund ta perdoresh kete per te bere ndonje parashikim per ndeshjen e ardhshme sepse nder te tjerash variablat si psh. lojtaret jane te ndryshem. Poashtu keto statistika nuk kapin edhe variabla me te sterholluara. Fjala vjen produkti i brendshem bruto i nje vendi ndikon ne cilesine e kampionatit te futbollit duke rritur cilesine se fundmi edhe te rezervave nga te cilat zgjidhen futbollistet e kombetares. Pra GDP ndikon ne rezultatin e nje ndeshjeje. Big Data meqe ra fjala eshte shume me e afte te gjeje relacione te tilla komplekse qe perdorin me mijera apo miliona variabla dhe te parashikoje rezultate ne dukje te rastesishme.
Dhe ketu vijme tek pika e dyte qe eshte me e sofistikuar por edhe me e rendesishme. Ka nje ligj ne statistike/kombinatorike qe quhet ligji i numrave te medhenj (law of large numbers) dhe problemi i futbollit eshte qe ngaqe numrat (e lojtareve, golave, aksioneve brenda ndeshjes) jane te vegjel fati apo rastesia kane rol te madh ne rezultat. Per ta shpjeguar kete le te marrim nje model ku futbolli luhet ne nje univers paralel dhe ekipet kane nga nje milione futbolliste. Poashtu fusha eshte nje milione here me e madhe se ajo qe njohim ne. A eshte rezultati me i parashikueshem a me pak i parashikueshem se futbolli tokesor? Pergjigja eshte qe ky futboll hipotetik me ekipe nje milioneshe eshte shume here me i parashikueshem sesa futbolli 11-tesh. Eshte e njejta aresye perse fjala vjen rastesia luan pak apo aspak rol tek GDP-te megjithese ato permbajne miliona apo miliarda variabla te rastesishme. Rastesia eshte me definicion asnjeanese dhe me numra te tille te medhenj i afrohet vleres se saj teorike.. zero. Pra rastesia luan rol shume here me te vogel per numra te tille te medhenj.
Pikerisht kete mungese numrash te medhenj mundohen te kompensojne statistikat sportive kur fusin ne te dhenat e tyre ndeshje te meparshme, ne menyre qe ta bejne rastesine te paperfillshme/asnjeanese. E megjthate shkencerisht eshte me e ndershme dhe mbase me e sakte te veshesh breket me te cilat ekipi yt ka fituar me pare apo te perdoresh te njejten marke cigaresh kur luan kombetarja.
Subjekti është disi kompleks për t’u trajtuar në kornizën e një komenti. Po mundohem të trajtoj pak vetëm statistikat e futbollit, pa u futur tek kazinoja dhe bursa, dhe mënyrën se si mund të përdoren ato për të parashikuar drejtimin e rezultatit përfundimtar të një ndeshje futbolli (1X2). Arsyetimi për parashikimin e rezultatit të saktë, numrit të korneve, numrit të kartelave të verdha a të kuqe etj. etj. evente që kuotohen nga bookmakers është pak a shumë I njëjtë, me përjashtim të hollësive teknike.
Së pari një sqarim lidhur me termin “statistika në futboll”. Fatkeqesisht ky term përdoret në dy kuptime, I pari I referohet lloj-lloj shifrave, kryesisht si ato që përmend Xha Xhai në pjesën e parë të këtij shkrimi. Keto lloj statistikash nuk kalojne kufirin e tipit “A e dini se….?” dhe nuk ngërthejnë ndonjë vlerë të veçantë si të përdorëshme për parashikime me arsyetimin që meqënëse ka ndodhur më parë disa herë kështu, ka për të ndodhur përsëri po kështu. Në kuptimin e dytë, ato I referohen një klase të dhënash që përbëjnë parametrat si “input” në ato që quhen “rating systems” (meqë ra fjala një nga këta “rating systems” është shumë I ngjashëm me sistemin ELO, që përdoret në shah, por është provuar që në rastin e futbollit nuk është më I miri). Qëllimi final është që pasi përpunohen këto të dhëna, output përfundimtar janë vetëm tre numra që janë probabilitetet përkatëse për fitoren e skuadrës pritëse (1), barazimin (X) dhe fitoren e skuadrës udhëtuese (2).
Siç shihet sistemet të ashtuquajtura parashikuese nuk parashikojnë drejtimin e rezultatit, ato vetëm sa llogarisin probabilitetet e përfundimeve të ndryshme. Mbi këtë bazë bookmakers caktojnë kuotat e basteve si invers (1/x) I këtyre probabiliteteve, me fjalë të tjera kuotat e bookmakers janë në përpjestim te zhdrejtë me vlerën përkatëse të probabilitetit. Pas kësaj bookmakers korrektojnë kutotat edhe për fitimin e tyre (që zakonisht është 4%-11%) pra I ulin të treja kuotat me përqindjen përkatëse. Në këtë mënyrë bookmakers garantojnë fitimin për vehte, sido që të përfundojnë ndeshjet.
Shtrohet pyetja: A egziston mundësia reale që rregullisht të fitohen para në baste duke e mundur bookmaker-in? Pra a ka një sistem që ta gjunjëzojë rregullisht bookmakerin? Së pari duhet thënë që kuotat bookmakers-at I vendosin mbi probabilitete të llogaritur nga specialistë futbolli në bashkëpunim të ngushtë me specialistë të statistikës që përdorin sisteme gjithnjë e më të provuar në korrektesën e tyre. (Po e përsëris, kur flitet për korrektesë e sistemit, flitet jo për faktin që sistemi në mënyre korrekte parashikon kush do ta fitojë ndeshjen, por për korrektesë në llogaritjen e probabiliteteve të rezultateve të ndryshme). Strategjia më e mirë për të mundur bookmaker-in është ajo që quhet zbulimi I “value bet” (ose basteve të vlershëm). Po e shpiegoj si bëhet kjo me një shembull të thjeshtë. Ta zeme se Sunderland do të luajë me Arsenal në Londër, pra si skuadër udhëtuese, dhe bookmakeri ka llogaritur si probabilitet të fitores së Sunderland 10% (0.1). Për një “fair bet” kuota në këtë rast duhet të jepej 10 (1/0.1 = 10), por siç e thamë bookmaker do të përfshijë edhe fitimin e vet, ta zemë 10%, atëhere kuota përfundimtare shpallet 9 (10-0.1×10=9). Bastvënësi përdor një sistem të vetin, sipas të cilit probabiliteti I fitores së Sunderlandit është 20%, pra sipas këtij sistemi kuota duhet të ishte 5, dhe me fitimin e bookmakerit përfundimisht 4.5. Ky bastvënës në këtë rast ka zbuluar një “value bet” sepse booki ofron një kuotë më të lartë (2 herë, nuk ndodh në praktikë, shëmbulli është për të ilustruar idenë, zakonisht mund ta konsiderosh vehten me fat po qe se zbulon “value bet” 10% – 20% më të lartë). Gjithësesi edhe kjo nuk jep asnjë garanci për fitoren e bastit, por nqs sistemi I bastvënësit është më I saktë në përllogaritjen e probabiliteteve, luajtja për një kohë të gjatë me atë system mund të japë kënaqësi jo të vogla.
Mund të përshkruaja këtu një system që përdoret për llogaritjen e probabiliteteve 1X2, por shpiegimi do të ishte tepër teknik dhe kushedi pa interes për shumicën e lexuesve.
Duhet thënë se bastvënësit që ndjekin këtë strategji janë shumë të pakët në numër në krahasim me turmën bastvënëse që ve baste, thjesht për qejf e tifozllëk pa u menduar shumë, ose akoma më keq ata që kanë varësi (addiction) nga bastet.