– litani e përligjur e një statisticieni
Inteligjenca artificiale (IA) është emri i ditës, ajo trajtohet si shpresa për shpërthimin e radhës në zhvillimin njerëzor, kur flitet për të dëgjon që ajo do krijojë makina më inteligjente se njeriu më inteligjent, e madje më inteligjente se të gjithë njerëzit të marrë së bashku. Për të flitet as më pak e as më shumë si për skenare filmash fantastiko-shkencorë të zbritur në realen e përditshme, njëjtë si për shembull Irobot me Will Smith-in, dhe këto priten të ndodhin brenda kësaj dekade. Pra ndoshta edhe më parë se Shqipëria të ketë hyrë ne BE. Kudo në botën e biznesit flitet për të, deri në pikën që të kujton ca direktiva të plenumeve të KQPPSH-së dikur, që futeshin kudo, që nuk mund të mos i përmendje. E përmendin burokratë dhe funksionarë korporatash që nuk kanë asnjë njohje të fushës përkatëse, e fusin si erëz në çdo diskutim, e bëjnë kërkesë të detyrueshme marrjen e kurseve për të, kurse të cilat janë çdo gjë pos inteligjente. Kjo më shkaktoi dyshimin e përsëritur mos gjithë kjo zallamahi ka diçka të pavërtetë. Frika që njerëzit kanë se IA do t’i nxjerrë jashtë loje, do t’i lerë pa punë, bën vetiu që ata ose ta fetishizojnë atë, ose të mundohen ta denigrojnë. Unë nuk e kam këtë frikë, sepse edhe pa IA një karriere i vjen fundi për shkak të moshës, por në përqasjet me të, kam patur zhgënjim profesional. Puna që unë bëj është modelimi statistikor, krijimi i modeleve statistikore, më së shumti i regresioneve, çka duke e patur si nënshtrat matematikën e zbatuar, janë më shumë se ajo, janë edhe art, krijim pothuaj i pastër dhe filozofi në kuptimin e shpjegimit të botës. Është pra një aspekt i punës intelektuale që kërkon edhe fantazi. Modelimi është krijimi i një bote të thjeshtuar, që punon mbi disa ndryshore të vëzhgueshme, të sjella në trajtë numerike edhe kur nuk janë numra, pasi pa numra makina nuk punon, dhe kjo botë ka një qëllim, të cilit modeli duhet t’i përafrohet sa më shumë të jetë e mundur, pra duke bërë gabimin më të vogël të mundshëm. Në këtë proces, modeli e shpjegon dhe e parashikon botën. Parashikimi (në anglisht quhet prediction, dhe kur ndodh në të ardhmen në skenare të simuluara, quhet forecasting,) është më pak inteligjent si proces. Ai rreket për gabimin më të vogël. Shpjegimi i fenomenit është më i ndërlikuar, sepse vlerëson sa ndikon secila prej ndryshoreve në parashikimin e rezultatit. Ndikimi i vërtetë i çdo ndryshoreje është shumë i rëndësishëm – unë ende nuk di sikur një rast që klientët që paguajnë për modelimin të kenë thënë nuk dua të di si ndikojnë ndryshoret e modelit, të cilat janë shpesh shtysa të veprimtarisë prodhuese të menaxhueshme nga korporata (the business drivers), por më intereson vetëm parashikimi. Me një intuitë të vetishme, ata kërkojnë pjesën më inteligjente të modelimit statistikor. Dhe këtu, deri tani, IA ka dështuar. Nuk po them se është e destinuar të dështojë gjithmonë. Them deri tani.
Natyrisht, kur shikon zbatimet e IA-së në robotë të cilët janë më prodhimtarë se njerëzit, pritshmëria është se ajo nuk duhet ta ketë problem krijimtarinë njerëzore në nivele të epërme. Një robot mund një kampion shahu, është i pathyeshëm kur luan ping-pong, mund të pastrojë shtëpinë, të korrë grurë, t’u japë përgjigje të sakta pyetjeve për të cilat ekzistojnë të dhëna tabulare, të dhëna që mund të kombinohen për të prodhuar diçka që nuk ka ekzistuar më parë në bazë të rregullave të përcaktuara dhe të kushtëzimeve. Pra duket sikur një robot mund të bëjë gjithçka. Fjala “gjithçka” është eufemike. Një makinë mund të shkruajë një roman për 30 minuta, por sa janë gjasat që ai roman të konkurrojë Uliksin apo Pashallëqet e mëdha?
IA-ja është a pathyeshme nga njerëzit për sa kohë ekziston një qëllim numerik që duhet arritur. Në qoftë se makinës i kërkohet të shkruajë një roman me 75 mijë fjalë, makina do ta realizojë atë më shpejt se gjithkush. Jepja në mëngjes dhe do ta kesh gati para dreke – kjo nuk është ironi, është e marrë nga një reklamë për programe shkruese të teksteve. Ajo do të shkruajë shumë romane mbi një temë të caktuar, të cilët plotësojnë të gjithë kushtin sasior të 75 mijë fjalëve. Pika kyçe qëndron në atë që qëllimi i njerëzve, një roman i mirë pas kutit të tyre, nuk mund të jetë (ende) qëllimi i mirë-përcaktuar dhe i kuantifikuar i makinës. Në këtë kuptim makina nuk na ka ndonjë borxh, dhe si tellalli thotë: “Fol zotrote të bërtas unë.” Ti si lexues, kërkon të lexosh një roman të mirë, natyrisht, por ti nuk mund ta shprehësh në mënyrë sasiore këtë. Qëllimi i njeriut mund të formalizohet një ditë (nuk kam as më të voglën ide si do mund të bëhet kjo, por kam siguri që në nivele të imta, në biologjinë njerëzore, pritshmëritë për romanin e mirë janë të kuantifikuara, dhe mund të kodohen, gjithnjë konceptualisht kjo.) Sepse njeriu në të vërtetë funksionon në parim si një makinë, në fakt e anasjellta është me e drejtë, puna është se ne nuk e dimë ende në detaj funksionimin e tij, algoritmet bazike të mendjes. Në u formalizoftë, mund të presësh Joyce-t dhe Tolstoi-t prej metali inoks citë me çipse kompjuterike. Por në qoftë se makina nuk e ka atë funksion qëllimi (objective function) është deri e pandershme të pritet prej saj të bëjë atë që bën njeriu. Makinat mund të na e kalojnë në vitin magjik 2029 (sipas Musk-ut të paktën), por nuk besoj të konkurrojnë me dilemën e një vajze një çast mëngjesi kur ndjen befas se mund të ketë rënë në dashuri. Vendimet “pro njeriut” ose “kundër njeriut” janë përfundime algoritmike dhe dikotomike të formalizuara. Ekziston një kod i shkrueshëm dhe i shkruar për to. Nga njerëzit. Njerëzit nuk kanë arritur të kodojnë dyshimin e bukur “mos kam rënë në dashuri” të vajzës së mëngjesit. Në qoftë se do të përpiqeshin, do ta kuantifikonin me numrin e vështrimeve, buzëqeshjeve, largësive fizike, kohën e vështrimeve të pandërprera, ndërsa vajza e mëngjesit mund ta ketë atë ndjenjë për djalin që shërben te luleshitësi, i cili e pa vetëm një herë! Me siguri ekziston një algoritëm për këtë në nivele tubulare kuantike në neurone, ta zëmë, po të besojmë ndërgjegjen/vetëdijen kuantike (Quantum consciousness) të Penrose-it dhe Hameroff-it, por formalizimi i kësaj duket si vite drite larg ende. Për makinën që mund shahistin problemi është i ndërsuazuar. Ka një numër të fundmë, edhe pse përbindshëm të madh, lëvizjesh dhe funksioni objektiv është i qartë: “vrasja” e mbretit. Ajo që makina bën është përpunimi i shumë mundësive, çka ajo e realizon me një shpejtësi më të madhe dhe shterim më të plotë se njeriu. Natyrisht, makina analizon edhe mjaft mundësira që për shahistin janë idiote dhe që ai i eliminon përmes një procesi të panjohur në thelb që ne e quajmë “instinktiv”, duke e ekonomizuar procesimin e tij të së dhënës, 64 kutitë e shahut dhe numrin e vendndodhjen e figurave në të, por fuqia përpunuese e makinës e sipëron atë të shahistit. Vini re, flitet shumë për kompjuterë të fuqishëm, dhe pak për kompjuterë “të zgjuar” (lexo inteligjentë për korrektesë politike dhe afiliim adekuat me frymën e kohës. Quantum computing, në fakt, është kompjuter më i fuqishëm se këta tanët e tanishëm. Përpunon më shumë. Njëjtë si misri hibrid që nuk i përdor më mirë elementet ushqyese të tokës dhe plehrave, por është në gjendje të metabolizojë më shumë në sasi se të varfrit misra të fshatit me stomak të vogël.) Sepse zgjuarsia është veti e algoritmit. Algoritmi mund të mësohet të (vetë)shkruajë algoritëm: a është ky një krijim i ngjashëm me atë që e quajmë krijim njerëzor, mbi të cilën mbështetet shkenca dhe arti? Algoritmi bëhet i zgjuar vetëm në qoftë se do të vetëpërsosë funksionin e qëllimit. Koncepti ndjenjë ka diçka nga aspekti gnoseologjik i fesë, e cila e përjashton dijen pasi bazohet në besim. Besimi dhe dija janë dyanshmërisht përjashtuese. Kur beson nuk di, kur di nuk beson. Kur themi ndjenjë, kemi pranuar pashpjegueshmërinë e saj, ndjenja me konvencion nuk shpjegohet, ajo vetëm përshkruhet, domethënë ndihet. Dhe mu për këtë ajo nuk bëhet dot funksion numerik qëllimi për makinën. Dita e shpjegimit dhe përshkrimit numerik të ndjenjës do të jetë dita e kapitullimit njerëzor, rënia e kështjellës së tij të fundit, sepse njeriu do te jetë më në fund i zëvendësueshëm me makinën. Nuk është puna kush do ta sipërojë tjetrin, kush “do fitojë”. Kur je i zëvendësueshëm, ke humbur në mënyrë të pakthyeshme. Pa nisur ndonjë betejë.
Para pak ditësh Elon Musk-u thoshte se ai e mendoi, siç thotë edhe emri përmes fjalës open (e hapur, e dhënë për gjithsecilin, falas), që OpenAI të ish një mjet i lirë, jo “i taksur” për fitim. Në të vërtetë atë e kthyen në të kundërtën e qëllimit fillestar, në mjet për fitim maksimal, vazhdoi ai. Vetëm fitimi mund të shpjegojë ethen “plenumore” do ta quaja, të propagandimit të IA-së në korporatën amerikane. Dhe mu aty m’u ndërmend rrugëtimi i gjatë në fushën e modelimit statistikor nga ajo që në zhargonin analitik të projekteve quhet statistika tradicionale në situatën e sotme të mbushur me emra kumbues, ku IA zë vendin e nderit, një farë “detyrë mbi detyrat” e llojit të vet. Këtu e 25 vjet më parë makina ishte e ndarë qartësisht nga njeriu, kish gjuhë statistikore që procesonin modele të ndërtuara nga modeluesi, si SAS, STATA etj., ku gjuha ish gjuhë, programi program dhe ndërtuesi i modelit, i konceptit zhvillues të procesit nga të dhëna në dije e mbi këtë pastaj në vendim (aso kohe departamentet e analitikës quheshin rëndom edhe të shkencës së vendimit, decision sciences, dhe detyra e tyre ishte germëpërgermshëm kthimi i të dhënave në dollarë fitimi), qëndronte sovran mbi këto. Por institucione si SAS ishin të shtrenjtë, SAS edhe sot është nga pikëpamja logjistike një qytet në pamje të parë futuristik, gati-gati si një komunë utopike (në Carry, Kalorinë e Veriut), me lëndina të përkujdesura dhe palestra e kopshte e shkolla për familjet e të punësuarve, dhe këto mbahen pikërisht nga çmimi që paguajnë përdoruesit e SAS-it (i cili më duhet të them edhe që “e ka hallall paranë.”) Entuziazmi për shkencën analitike dhe programimin në tërësi, bëri që profesorë universitetesh dhe studiues të zhvillonin një gjuhë të re, konkurrente edhe me SAS-in, të lirë për gjithkënd që kishte një kompjuter dhe lidhje me internetin për ta shkarkuar, të quajtur R, e cila ngaqë ushqehej nga një “mendje kolektive” (ose supermind – dikur kish 4 mijë universitete që kontribuonin, sot nuk e di sa është ky numër), praktikisht e pakonkurrueshme nga rrekje të tjera intelektuale tokësore, me një vjegë të vogël: përdorimi i R nuk shoqërohej nga shërbime për klientin, pasi ishte falas (kalit të falur nuk i shihen dhëmbët). Po ndodhte ajo që parashikonte Freeman Dyson-i, një shkëmbim i lirë, puro cerebral, pa axhenda apo qëllime fitimi, gjenetik, i ngjashëm me organizmat e hershme paraqelizore, pa membrana e kufij ndarës, çka të bën të besosh se dikur, diku, një një galaktikë shumë-shumë të largët, komunizmi si praktikë e doktrinës fillestare mund edhe të ketë një shans. Por, siç i ngjau Freeman-it me programet e tij dhe të tjerëve si ai, apo edhe organizmit të lashtë paraqelizor, ia behën organizma mamuthore si Microsoft-i i “bamirësit të sotëm” Bill Gates apo qeliza e parë eukariote, përkatësisht, të cilat nuk e donin shkëmbimin pa të keq e fitim, që vendosën një hegjemoni monopoliste mbi rrethinat përkatëse (ne, dhe praktikisht çdo organizëm i gjallë, jemi mbartës të atyre qelizave monopoliste, të mbyllura dhe diktatoriale, që mund të shpjegojë shumëçka mbi qenien tonë somatike, shoqërore, por edhe karakteriale). Edhe R filloi të konkurrohej vetë nga një tjetër gjuhë e burimit të hapur (falas për gjithkënd): Python. Ky i fundit duket se po e fiton garën me R. Jo se është analitikisht më i përparuar se R, përkundrazi, por se është më i pëlqyer nga publiku përdorues, i cili nuk e vret shumë për thellësitë analitike, aq sa për grafiqe te bukur dhe shfaqje goditëse virtuale (dashboard-et e famshme). Analitika e mirë, sikundër edhe arti i mirë, janë elitarë. Nuk janë të menduar për vijë masash. Për shitje. Berihaje të ngazëllyera fshatçe. Trokëllima duarsh ritmike katër-rrokëshe.
I kujtoj si sot kohët kur myteberë të Microsoft-it behën në kompanitë e të dhënave dhe të analitikës me një koncept krejt ndryshe, të mbartur prej andej, masovik (Bill Gates u bë ai që është pikërisht me masivizimin e kompjuterit, ku gjithkush mund ta përdorë atë; për mua ai miu rodent i kompjuterit është po aq shndërrues sa motori me djegie të brendshme i James Watt-it,) ata nuk donin të ndërtonin modele, sikur një rrobaqepës me emër dhe famë një kostum për klientin vetmor, një farë orëndreqësi i Orëve të Kremlinit (një, po luan ama,) ata donin që modelet të shiteshin kudo, sa më gjerësisht, dhe më e rëndësishmja, që modele të ish i aftë t’i ndërtonte kushdo e kudo që të ndodhej. Ishte koha (Zot, nuk janë veç pako vite që na ndajnë prej saj e megjithatë duken si dekada) kur emra të tillë si Machine Learning (ML, të mësuarit e makinës, pra makina që mësonte) apo Deep Learning, sundonin gjithë peizazhin analitik. Për to kish rëndësi themelore që gjithkush me një fjalëkyç e abonim (këtu ishte i gjithë thelbi i ndërmarrjes, pagesa e atij të uruari abonim,) të ishte i aftë të përdorte modele nga çdo kënd i botës (kjo erdh me renë e Cloud Computing, nje farë olimpi qiellor i magazinimit dhe ruajtjes së të dhënave, informacionit dhe modeleve, me pak sharm Fantozzi, si erëz e lindjes plot me qilima fluturues.) Edhe fjala teknike e përdorimit të modeleve kishte një lloj tingëllime kapitaliste: Deployment. U krijua përshtypja që këto mrroklla (gadgets) ishin të mbinatyrshme, me jep të dhënat, se i fus unë në ca gjëra ashtu, dhe ti merr rezultatin kudo qofsh, në Maldive, Vërzhezhë, apo Guam. Procesi i ndërtimit të modelit, kontributi themelor i inteligjencës njerëzore, u la në heshtje, askush nuk fliste për të, u krijua një paketë me modele të tipit “kuti e zezë” (black box), ku kurrkush nuk dinte ç’bëhej atje, një lloj hocus-pocus apo abracadabra, ku në fund ti merrje një rezultat. Jam shtangur kur i kam përdorur fillimisht këto mrroklla (Azure për Microsoft-in), për cektësinë e inteligjencës së tyre dhe përsosjen e lehtësisë së përdorimit, për sa kohë nuk bëhej asnjë pyetje e vërtetë nga përdoruesi. Parashikimi triumfoi mbi shpjegim-kuptimin e proceseve. Sepse, në të vërtetë, inteligjenca pavarësisht prej mënyrës si e përdorim, nuk shet. Shet lehtësia e përdorimit. Por ky është një proces mbarëbotëror: a nuk është në thelb e njëjta gjë triumfi i hajeve të paketuara? Një kuti e ngrirë që kërkon një mikrovalë dhe udhëzim përdorimi shkruar me harfe të vogla mbi kuti, i nxori jashtë përdorimit gjyshet e talentuara nga kuzhinat tona. Që gatuanin për tryezën tonë dhe për ne, ku krahas talentit dhe përvojës, shtinin në haje përbërësin themelor të gatimit: dashurinë.
Ka një hollësi teknike që po të mos ish e rëndësishme, nuk do ta thosha: në modele, funksioni i qëllimit është gabimi më i vogël i mundshëm. Për shkak se ndryshoret shpjeguese në një model nuk janë të pavarura nga njëra-tjetra (orthogonal and independent), në fund të procesit, gabimi më i vogël, si rregull, nuk arrihet domosdoshmërisht nga modeli që u jep elementëve të vet peshën shpjeguese të duhur, të paanshme (unbiased). Modeli më i saktë për të dhënat që po modelohen, nuk do të thotë që është edhe më i miri në shpjegueshmëri – ky i fundit është, në fakt, modeli më qëndrueshëm (robust) dhe kopja më besnike e realitetit. Model më i mençur, si me thënë. Kësisoji, përzgjedhja e variableve shpjeguese si dhe transformimi i tyre, është salca e fshehtë që e bën një model shpjegues të dukurisë që po modelohet. Kjo kërkon edhe intuitë të modeluesit, talent, dhe mbi të gjitha një fantazi që lidhet me përvojën, që është pothuajse ndjenjë, ajo që e quajnë “gut-given feelings”. I përndezur nga berihaji, unë prisja që këtë gjë ta bënte automatikisht mrroklla e Microsoft-it, apo edhe e emrave të tjerë gjigandë, si Google, psh. Imagjinoni zhgënjimin tim prej faktit se ato nuk merreshin fare me këtë proces, ato i merrnin ndryshoret siç ishin dhe i hidhnin në model, pas parimit të sqollit të kuzhinës (kitchen sink regression), dhe kalo matanë, vërdhoja se kemi modele për të shitur, modele të lehtë në të kuptuar dhe të shpejtë në të zbatuar, siç thoshim dikur për stërvitjen ushtarake në zboret tanë me forë. Mos harroni se çdo ndryshore e shtuar në model nuk i prish punë saktësisë së parashikimit, pra mund të shtonit edhe datëlindjet në një ekuacion që nuk ka aspak punë me moshën e njeriut, e të mos ndikojë fare, ose mund ta bëjë të parashikojë më mirë të dhënat konkrete që po modelohen (por jo të tjera të dhëna të të njëjtit problem), por matematikisht nuk prodhon parashikim më të keq: pra, sa më shumë ndryshore, aq më mirë. Për shpjegimin e fenomenit që modelohet pastaj, çfarë ndikon më shumë, në ç’kahje ndikon, pozitivisht a negativisht, kjo është një histori tjetër. Për këtë ka një parim modelues “pak e saktë” që quhet “parsimony” ose edhe Occam’s razor. Kjo është bazë e ekuacioneve strukturore (structural equations.) Ai parim është shumë i vështirë të automatizohet, pasi nënkupton edhe intuitën njerëzore. Njëra nga korporatat ku kam punuar edhe si konsulent, edhe si i punësuar drejtpërdrejt, kohë përpara gumëzhimës së IA-së, kishte krijuar një produkt për automatizim modelimi. Në prapavijë kishte raste që konkurronin edhe 5 mijë modele për zgjidhjen (modelin) përfundimtar. Nuk di asnjë rast, e përsëris asnjë rast, ku modeli përfundimtar i prodhuar të mos kish nevojë për ndërhyrje njerëzore, e në një shumicë shqetësuese, ai nuk kishte as kuptim interpretativ. Si do interpretosh, të themi të ardhurat mujore në fuqi të 4/7-at, si do interpretosh rrënjën me eksponent 2/5 apo edhe inversin e logaritmit natyror e, të themi, shtesës vjetore të popullsisë së një konteje?
Me gjithë emrat kumbues, mësimi i thellë, apo të mësuarit e makinës, që të kujtojnë parulla të Kinës së Maos, ato nuk bënin as atë çka bënte statisticieni e modeluesi fillestar në kohë që tash duken si para Gilgameshit në ndjenjë, por një grusht dore në vite më parë. E gjithë histeria merkantile e ML kishte dicka që nuk shkonte. Kudo fliteshin mrekullitë e saj, përparimet në ndërfutjen e saj në praktikat e përditshme të korporatës, por atje tej, në prapaskenë, larg nga podiumet e mbledhjeve, nga takimet e Teams-it apo Zoom-it të internetit, thirrej herët a vonë statisticieni i dikurshëm, ustai, që i bënte gjërat me kokë njerëzore dhe inteligjencë prej vërteti, nga ajo e mira, statisticieni që tani i thonë, një Zot e di pse e përse, shkencëtar të dhënash (data scientist), sikur dhe statistikës dhe ekonometrisë shkencë e të dhënave (data science), thirrej dhe i thuhej ndërtona një model që punon, që ta fusim në këto mrrokllat tona moderne, me emra që shesin, se ato nuk e bëjnë dot atë që bën ti. Kaq thjeshtë, pastër e pa stolira.
Por nuk kaloi shumë me këtë dalldi makinash që mësonin në analitikë, edhe ia behu aktualja, e sotmja, e përditësuara, frymëzuesja e gjithë fitorjeve tona, miliard-dollarë-shitësja IA. Gjithë me shpresën se do t’ia sëllojë të ndërtojë modele statistikore nga ato të mirat, të vjetrat, si prej terziu (Dy çuna që ka Tirona, bojn harap nji kasaba). Projekti që kam në dorë tani që flasim e ka qysh në titull përfshirjen e IA-së në modelim. Është pra një kërkesë. Në mbledhjen e parë që u bë, u tha qartë që do përdorim statistikën tradicionale që nuk të lë në baltë, kostumet e qepura enkas për zotin Filip, apo Martin nga Mustafai apo Sadiku i këngës, dhe jo për gjithë Filipët, Martinët, apo Xhejmsët e botës, por për këta tanët, të projektit, që tek e fundit paguajnë faturat tona. Për mua fjala customized ka qenë gjithnjë magjike. Është i terezitur ekskluzivisht për ju, zotni. Menduar, imagjinuar, dhe sendërtuar për merak. E kemi paketuar me inteligjencë artificiale, se edhe juve, edhe neve na duhet të themi ashtu. Por në fakt është e bërë me inteligjencë vendi, nga ajo e mira, organike, hairloom, e kilometrit zero. Ta përdorni gëzuar.
(c) 2025 Shkëlqim Çela, PhD. Të gjitha të drejtat janë të autorit. Imazhi në kopertinë është përfytyruar me Ideogram.