Peizazhe të fjalës

ose natyra jo aq të qeta
Statistikë

ODDS RATIO – PERCEPTIMI, PARAGJYKIMI

nga Shkëlqim Çela

Odds (“t”) është masa e gjasës që një dukuri apo rezultat i veçantë të ndodhë. Për një probabilitet p, t = p/(1 – p). Për shembull, në qoftë se probabiliteti që nesër bie shi është 0.75, t = 0.75/(1-0.75) = 3. Kjo do të thotë se ka tri herë më tepër gjasë të bjerë shi se të mos bjerë. Ky raport probabilitetesh të një ngjarjeje, që ajo të ndodhë apo të mos ndodhë, është shumë i qenësishëm në bixhoz apo baste sporti; në shqip nuk di të ketë një fjalë të drejtpërdrejtë për odds; duket nuk jemi popull shumë statistikor, odds e përkthejmë si “shanse” dhe shanseve nuk ua dimë mirë anën. Odds në vetvete, është një raport, një thyesë, një përpjesëtim, po mbi të gjitha, një krahasim. E veçanta e odds është se pjesëton pjesëtime; probabiliteti në kuptimin thelbor frekuentist të tij është në fund të fundit një pjesëtim i pjesës me të tërën. Çka na sjell te pyetja e thjeshtë: ç’domethënë një probabilitet 0.75, jo nga pikëpamja konceptuale, as filozofike, por e thjeshtuar deri në themel? Kjo do të thotë që në 100 realitete virtuale (hipotetike), pra në 100 të nesërme të tilla, në 75 prej tyre të bjerë shi, dhe në 25 jo. Probabiliteti, me përkufizim, është një raport i drejtpërdrejtë i dendurisë së realizimit të ngjarjes përkatëse me të tërën: për rastin, 75 / (75+25) = 0.75. Ky probabilitet quhet edhe risk, dhe nuk është e njëjta gjë me odds, i cili për rastin është siç u përmend 75/25 = 3.

Në qoftë se kalojmë në një zonë klimatike më të thatë, për të ndjekur shembullin e mësipërm, probabiliteti i shiut të nesërm mund të jetë më i vogël, le të themi 10%. Odds për shiun në këtë rast është 10/90 = 0.11(1), ndërsa risku është vetë probabiliteti: 0.1. Kuptohet, sa më i vogël probabiliteti, aq më shumë odds i përafrohet riskut si vlerë numerike. Po të krahasojmë dy rastet lidhur me gjasën e shiut, krahasimi i risqeve të tyre do të na jepte “riskun relativ”: 0.75 / 0.1 = 7.5. Ndërsa i njëjti krahasim i odds do të prodhonte të shumëpërdorurin odds ratio (OR):  3 / 0.11(1) = 27.

Siç shihet, ka një dallim të qenësishëm numerik midis riskut relativ dhe OR, dallim që e meriton të shqyrtohet, jo aq nga pikëpamja statistikore (vlen të thuhet se përdorimi i OR i detyrohet më së shumti faktit që, si rregull, është e vështirë ose e pamundur të vëzhgohet e gjithë popullata e elementëve që bëjnë probabilitetin natyror të dukurisë), sa nga domethënia dhe perceptimi i së njëjtës ngjarjeje: shiu i nesërm në dy rajone me sasi të ndryshme rreshjesh. Një probabilitet i dhënë i një ngjarjeje prodhon një odds të përcaktuar; lidhja mes tyre është matematikore dhe jo statistikore: t = p/(1 – p). Por po kështu, një odds i caktuar lidhet vetëm me një probabilitet përkatës:  p=t/(1+t). I njëjti informacion përmbahet si në p edhe në t (ne themi t dhe nënkuptojmë p, ne themi p dhe nënkuptojmë t). Atëherë ç’e shkakton nevojën për të patur dy tregues për të njëjtin informacion? Ndoshta ngaqë OR e jep më të prekshme ndjesinë e krahasimit?

Vëzhgimi në të vërtetë është krahasim; pa krahasim nuk mund të ketë vëzhgim (sepse nuk ka në fakt lëvizje si të tillë në përvetimin shqisor të realitetit), sado paradoksale mund të duket kjo. Në qoftë se do të shikonim vetëm një pikë, në të vërtetë nuk do të ishim duke shikuar. Informacionin për pikën e vëzhguar ne e marrim veç prej krahasimit me pikat e tjera përreth, ose me të njëjtën pikë në kohë të ndryshme, përsa kohë kjo sjell ndryshim të vetë pikës (diakronikisht). Ose në qoftë se do shikonim një fushë livadhore njëngjyrëshe, ku pikat e pamjeve nuk do të ndryshonin prej njëra-tjetrës, përsëri nuk do të ishim duke shikuar me të vërtetë. Në këtë kuptim, ne përvetojmë një fushë të bukur të blertë njëngjyrëshe vetëm duke e pranëvënë me qiellin e kaltër mbi të. Koncepti aq i përhapur i benchmark-ut është pikërisht realizimi i krahasimit të një objekti me një tjetër. Baza e pandryshueshme e krahasimit formëson benchmark-un, ose atë që njihet në provat statistikore si “kontroll”. Aq i rëndësishëm është ky i fundit, saqë në themelin e punës studimore dhe vlerësuese e analitike është mantra: pa kontroll nuk ka përfundim (no control, no conclusion). Krahasimi me një “kontroll” apo benchmark ka në bazën e tij një raport madhësish, frekuencash apo dendurish, çka në fund të fundit është një OR. Shpesh probabilitetet e ngjarjeve me rëndësi në jetët tona janë numerikisht shumë të vogla; ato janë të rëndësishme pikërisht se janë të pazakonta, dhe “janë të pazakonta” do të thotë që gjasat e tyre janë shumë të vogla. Për shembull, le të marrim kriminalitetin në një rajon të dhënë A gjatë një kohe të caktuar. Në shumicën e tyre dërrmuese, njerëzit nuk kryejnë krime, pra le të themi se kemi një lloj të dhënë krimi i cili ndodh një herë në 500 persona. Probabiliteti i krimit në fjalë është 1/500 = 0.002 = 0.2%. Ndërsa odds = 1/499, që është shumë afër probabilitetit. Në një fshat me dy mijë banorë, priten 4 krime për periudhën e dhënë kohore (psh një vit). Njerëzit e rajonit A mësohen me këtë normë si me çdo të dhënë të parë të jetës dhe ngjarje të rrallë. Ata nuk bëjnë llogaritjen e probabilitetit apo odds në mënyrë të ndërgjegjshme, por ka të ngjarë ta lexojnë atë në të dhënat e zonës që jo rrallë shoqërojnë përshkrimet e saj prej kompanive të pasurive të paluajtshme. Ndërkaq, një rajon tjetër B e ka probabilitetin e krimit në fjalë, le të themi 0.6%: në 500 persona janë mesatarisht 3 që e kryejnë krimin. Përsëri shumica dërrmuese e njerzve janë “të papërlyer”, por OR = 3. Në B krimi në fjalë është 3 herë më i mundur se në A! OR e thjeshton (cancels out) masën, të zakonshmen dhe të përditshmen, pra numrin 500 në përshkrimin e mësipërm dhe merret vetëm me masën absolute të krimit: 3 dhe 1. Një probabilitet 0.2% dhe 0.6% janë ndoshta të pandjeshëm si përditshmëri, por krahasimi mes tyre prodhon një raport 3 me 1 dhe rajoni B, ku jeta në lidhje me krimin në fjalë (le të themi vjedhje biçikletash) është e përafërt me A-në, paraqitet si një zonë ku biçikletat (dhe mbase edhe mallra të tjera me bashkëshoqërim ideje) vidhen tre herë më shumë. Është pikërisht ky raport që jo rrallë prodhon perceptimin e B-së si një vend ku duhet patur kujdes se “ta fshinë biçikletën” dhe zinxhirët me të cilët ajo lidhet pas shtyllave duhen blerë rrjedhimisht më të trashë. Natyrisht, një rajon tjetër C me probabilitet 1.8% të krimit do ta shihte B-ënë si një parajsë të biçikletave; tek e fundit atje vidhet 3 herë më pak se në C.

Perceptimet e mësipërme prodhojnë paragjykimin se në C “bëhet nami” ndërsa në A jo. Natyrisht, dikush do të sqarojë se “jo të gjithë në C vjedhin biçikleta”, se banorët e C-së janë njerëz që e respektojnë ligjin dhe se “nami i përhapur” është një paragjykim që duhet çrrënjosur. Ndërkaq, vihet re jo rrallë se mënyra e të konceptuarit të realitetit i përgjigjet qasjes “në C ta përlanë biçikletën”. Sepse normalja e të përditshmes, për rastin ajo që si rregull njerëzit i lënë biçikletat ndanë trotuarëve dhe i gjejnë prapë aty, nuk ngjit në formimin e perceptimit. Ajo thjeshtohet, pikërisht siç bëhet në formulën e OR.

Kalimi nga perceptimi në paragjykim është pothuajse i pritshëm dhe i natyrshëm. Në logjikën dhe utësinë popullore ai gjen vend në shprehje si “një dru i shtrembër prish gjithë stivën”, duke i mëshuar rolit të ngjarjes apo dukurisë së pazakontë.

Ka shumë të ngjarë që një qasje e tillë të ketë karakter evolucionar dhe t’i shërbejë ruajtjes së llojit. Syçeltësia shpërpjestimore lidhur me sinjale të caktuara nga rrethina, që vërehet në botën e kafshëve (dhe jo veç te njeriu), ka shumë të ngjarë të jetë evolutive. Të djegësh për një plesht jorganin përkthehet si mbijetesë dhe jo sqimë a kujdes i tepruar. Mekanizmi i vendimit në nivele elementare (neuronesh) është një Po/Jo dikotomike Booleane – jo rastësisht gjuha bazë në informatike, assemby language, bazohet në dilemën dyshe Po/Jo – dhe realizohet me zgjidhjen e funksionit të utilitetit (utility function), i cili është një produkt i masës së Humbjes me gjasën përkatëse. Humbje shumë të mëdha, për shembull të jetës së individit të gjallë, bëjnë të qenësishme probabilite tejet të vogla, praktikisht zero virtuale (por jo absolute). Njeriu nuk është i ndërgjegjshëm për shumë procese vendimi që ndodhin në nivele elementare. Shumica e njerzve që marrin vendime për të kaluar kryqëzimet ne dritë të verdhë të semaforit, ose edhe të kuqe sa për atë punë, nuk e njohin as probabilitetin, as funksionin e Humbjes; është Evolucioni ai që ka ndërtuar gjithë laboratorët e nevojshëm me algoritme të automatizuara në qeniet tona për t’i shpëtuar këto të fundit (me saktë, kanë shpëtuar dhe natyrisht janë riprodhuar ato qenie që i kishin laboratorët funksionues), laboratorë për të cilët nuk kemi asnjë ide se ekzistojnë. Në këtë suazë vepron edhe mekanizmi i OR, që gjeneron perceptim e më pas paragjykim. Paragjykimi është tejet i paragjykuar, pasi cilësohet si arritje konkluzioni pa patur, apo pa u mbështetur mbi të dhëna përkatëse për një dukuri apo objekt të dhënë. Në një kohë që pa paragjykim, pa ato që shpesh quhen “klishe”, “dogma”, apo “skema të dhëna”, ekzistenca dhe suksesi ynë në botë do të viheshin në pikëpyetje të mëdha. Kur një gazelë ndjen një lëvizje në barërat e egra, ajo menjëherë vihet në alarm mos një tigër apo luan po avitet që t’i hidhet e ta sulmojë, edhe pse në atë fëshfërimë ka shumë-shumë të ngjarë të jetë duke luajtur era. Gazela e paragjykon savanën. Dhe ky paragjykim është themelor në ruajtjen e jetës së saj (“better safe than sorry”). Shumica dërrmuese e paragjykimeve janë të ndërtuara mbi OR (e njëjta gjuhë bazë e natyrës, matematika, siç është edhe funksioni i utilitetit në vendimet bazë Booleane që thamë më lart), për gazelën një fëshfërimë e caktuar ka një OR domethënës për qenien e një predatori krahasuar me një qetësi relative si “kontroll”, fëshfërima edhe më të buta të barit, ndërkohë që në të dyja situatat, ka shumë të ngjarë që të mos ketë asnjë predator atypari.

Lufta kundër paragjykimit është lufta kundër diçkaje të natyrshme, dhe si e tillë është e panatyrshme, e sforcuar, e moskuptuar dhe jo rrallë e dëmshme. Shpesh herë ngrihemi kundër klisheve me klishe edhe më të mëdha. Paragjykimi (pjesë e statistikës aq në modë bayesiane përmes “probabilitetit të mëparshëm”, prior probability) duhet kuptuar para se të anatemohet. Sidomos kur na paragjykojnë.

© 2024 Shkëlqim Çela. Të gjitha të drejtat janë të autorit.

Zbuloni më tepër nga Peizazhe të fjalës

Pajtohuni tani, që të vazhdoni të lexoni dhe të përfitoni hyrjen te arkivi i plotë.

Vazhdoni leximin