Peizazhe të fjalës

ose natyra jo aq të qeta
Gjuhësi

DIELLA DHE ROBO-SHQIPJA

(Enkeleida Kapia është anëtare e Institutit të Gjuhësisë dhe Letërsisë në Tiranë, e specializuar në lëmë të gjuhësisë së zbatuar. Momentalisht bashkëpunon me kolegë në Universitetin Ludwig-Maximilian në Mynih për një projekt mbi prozodinë e shqipes dhe pikëprerjet e saj me rrafshet e tjera të gramatikës (sintaksë, etj) në aspektin teorik dhe aplikativ. Falë punës së përbashkët, ata kanë krijuar dhe trajnuar një model të inteligjencës artificiale (angl. AI) që realizon ASR (angl. Automatic Speech Recognition) për shqipen.)

  1. I takon së tashmes

Takohem me Diellën, asistenten virtuale në e-Albania. Më prezantohet dhe më fton t‘i bëj një pyetje. Kuptohet mirë Diella, mendoj, por nuk e di pse e folura e saj më tingëllon e çuditshme. E vë prapë të më përshëndesë. Prapë diçka më bezdis. Diella, paçka veshjes së saj folklorike, jo vetëm që nuk më flet si zadrimore, por nuk më flet në asnjë nga të folmet e shqipes që njoh e studioj përditë – nuk më flet tamam si shqiptare. Diella flet robo-shqip. Nëse do përdorja një superlativë që vjen nga gjermanishtja, Diella është padyshim një über produkt dhe si shumica e asistentëve virtualë, i shqipton mirë fjalët, por ka probleme të theksuara me melodinë e gjuhës. Ose siç i thonë ndryshe gjuhëtarët, intonacionin. Po nuk ka nevojë të merresh me gjuhësi që ta dallosh këtë gjë. Nuk është, në fakt, as e para dhe as e fundit Diella që çalon në këtë pikë; Siri, Alexa dhe Cortona, asistente virtuale shumë më të moçme se Diella, gjithashtu ta vrisnin veshin me intonacionin e çuditshëm kur u krijuan rishtazi; madje, sipas specialistëve, ende nuk e kanë përsosur tërësisht përdorimin e intonacionit në gjuhë[1],[2],[3].

  1. Si mësoi Diella shqip?

Duhet të them pikësëpari që unë nuk kam qenë pjesë e grupit të punës që ka krijuar dhe trajnuar Diellën, kështu që nuk i di me siguri hapat specifike që ka ndjekur ekipi në Agjencinë Kombëtare të Shoqërisë Informative. U bëj me këtë rast një ftesë publike për të mbajtur një ligjëratë në Institutin e Gjuhësisë në Tiranë, ku me siguri kolegët e mi do ta mirëprisnin një nismë për në paraqitje të tillë. Sidoqoftë, ustallëku në punët e mia të përditshme kërkimore-shkencore më lejon të bëj hamendësime të informuara për mënyrën se si mund të ketë mësuar Diella shqip.

Fillimisht, nuk ishte fjala. Fillimisht u krijua një model i intelligjencës artificiale i cili vjen në jetë i pafjalë, i pagjuhë. Këtë model imagjinojeni si një foshnjë[4] e cila e ka kapacitetin për të mësuar gjuhën (në këtë kuptim nuk është tabula rasa), por që në momentin që ka ardhur në jetë nuk mund të japë e të marrë aspak përmes gjuhës. Si foshnja, Diella kur lind, nuk flet dhe nuk kupton gjë prej gjëje.  Për këtë i duhet të trajnohet me të dhëna gjuhësore. Ashtu si edhe njerëzit të cilët për të mësuar gjuhën u duhet të gjëllijnë të kredhur në një bashkësi gjuhësore (përndryshe na vjen ndërmend rasti i vogëlushes Ginie e cila e dënuar diku pa kontakt njerëzor nuk arriti kurrë të mësonte të fliste), ashtu edhe Diellës i duhet të ekspozohet me të dhëna gjuhësore nga shqipja. Këto të dhëna vijnë fillimisht në formatin audio, pra janë thjesht gjithfarë bisedash zanore të rregjistruara andej-këndej, me gjasa në kontekste ku flitet shqip natyrshëm. Diella i “dëgjon” dhe fillon t’i kategorizojë audiot e ndryshme për karakteristikat e tyre të veçanta, p.sh. për tingujt, për thekset, për ritmin, trashësinë, intensitetin, timbrin, ndoshta gjininë, të folmet, etj, etj, njësoj siç bën edhe fëmija pa vetëdije kur fillon të mësojë gjuhën amtare në vegjëli. Mirëpo, ndryshe nga fëmija, e cila përmes konteksit pamor mund të zbulojë kuptimet e mesazheve që i thuhen, Diella nuk mundet, sepse nuk e ka shqisën e të parit. Diellës i mungon konteksti që i jep kuptim thënies, i mungon aspekti pamor i gjuhës. Për këtë Diellës, i duhen ushqyer artificialisht tekstet e të gjitha audiove që krijuesit e saj i vënë të dëgjojë rregullisht. Pra, në qoftë se Diella ka dëgjuar me mijëra gjithfarë bisedash me zë mes njerëzve të ndryshëm, të gjitha këto biseda me siguri janë zbardhur për të nga krijuesit e saj në formë tekstuale (me shkrim), në mënyrë që ajo të mund të zbulojë marrëdhëniet mes fjalëve, funksionet e tyre dhe si lidhen ato me njëra-tjetrën.

Por që Diella të mësojë të flasë, nuk mjafton vetëm që Diellës t’ja shkruash ato që ajo dëgjon, duhet edhe t’i përcaktosh shumë e shumë rregulla të tjera, ndryshe nga fëmija. Për shembull, duhet t’i përcaktosh se cilët janë emrat, foljet, mbiemrat, përmerat, etj, si edhe të gjitha mbaresat që mund të marrin këto pjesë të ligjëratës në përdorimin e tyre në fjali, etj. Thelbi është ky: në se duam që Diella të flasë me ne, duhet që ajo të kuptojë vetë disa parime themelore të shqipes: për shembull, që janë frymorët ose sendet ata që pësojnë ose kryejnë veprimet dhe mund të shërbejnë si kryefjalë, që gjymtyra që shpreh një veprim, një gjendje ose një tipar të frymorit a të sendit që shënohet nga kryefjala është kallëzuesi, dhe që për të shprehur një kundrinor të njohur në bisedë e shoqërojmë gjithmonë, po gjithmonë ama, me një trajtë të shkurtër, përndryshe ky kundrinor është i panjohur në ligjërim. Këtë proces e quajmë anotim. Këto anotime Diellës ja bëjmë gati llokum dhe ajo i mëson pakashumë përmendësh. Sa herë që dëgjon audiot, i ushqejmë edhe tekstet e audiove me anotimet përkatëse. Dhe, kështu, Diella mëson të dallojë modelet e gatshme të ngulitura në këto të dhëna me të cilat ushqehet në mënyrë të vijueshme, pa ndërprerje. Çdo ditë i shtojmë biseda të reja, autentike, nga folës të ndryshëm, në mënyrë që ajo të ketë mundësi të dallojë këto modele edhe në kontekste të cilat nuk i ka hasur më parë. Ky proces merr detyrimisht muaj të tërë. Madje, sipas faqes së Agjencisë Kombëtare të Shoqërisë Informative[5]:,

“Asistenti Virtual 2.0 vjen një vit pas lançimit të asistentit të parë virtual 1.0, i cili regjistroi më tepër se 1 milion pyetje/përgjigje, të cilat ndihmuan gjithashtu në krijimin e asistentit të ri virtual në një variant të përmirësuar.”

Kjo do të thotë që në fazën e Diellës 1.0, çdo pyetje zanore që iu drejtua Diellës nga qytetarët shqiptarë ose “më tepër se 1 milionë pyetje/përgjigje”, siç theksohet edhe në mesazhin e mësipërm, u rregjistruan nga platforma e-Albania dhe u përdorën si të dhëna gjuhësore për të trajnuar Diellën (shpresoj duke iu marrë leje qytetarëve për këtë përdorim të të dhënave të tyre për studimin konkret). Sot mundohem të komunikoj me zë me Diellën (pra, versionin Diella 2.0), por edhe pse aty gjendet një ikonë mikrofoni, unë nuk arrij të rregjistroj dot gjë. Nuk e di, pra, nëse ky funksion është çmontuar momentalisht ose nuk funksionon vetëm për mua. Sidoqoftë, sot, përpara se ta përdorësh Diellën, platforma të detyron të “pranosh” [PRANOJ] një kontratë midis tyre dhe teje, e cila me siguri ka vlerë ligjore. Kjo kontratë m; informon mua si qytetare që me Diellën mund të flas vetëm për çështje që kanë lidhje me e-Albania, që unë nuk mund të përdor gjuhë abuzive, që përgjigjet e Diellës janë thjesht këshilluese, etj, etj., por nuk të informon që të dhënat e tua zanore do të përdoren për përmirësimin e mëtejshëm të Diellës. Kjo nënkupton që krijuesit e Diellës me siguri nuk janë duke vjelë më të dhëna zanore prej nesh (por këtë nuk e di me siguri të plotë). Sikurse e thashë, unë personalisht nuk komunikoj dot me Diellën me zë, vetëm me shkrim. Për trajnimin e saj me shkrim (si dhe format e ndryshme informale që ka marrë shkrimi shqip sot), ia vlen të shkruhet diçka tjetër.

Sidoqoftë, duhet theksuar që ndryshe nga fëmija e cila do 6-7 vite të fillojë të flasë rrjedhshëm, Diella vjen me mjeshtëri tek kjo arritje për një kohë shumë më të shkurtër. Diella është vërtet një über produkt! Nuk përshkon madje as hapat e belbëzimit, rrokjezimit apo dy-fjalëshave që kalojnë bebet; ajo thjesht fillon të flasë menjëherë me fjali të plota. Por, ama, çalon tek intonacioni. Me gjasa Diellës nuk i janë dhënë anotime të sakta të funksionimit të intonacionit të shqipes (ose ndoshta nuk është bërë ndonjë anotim prozodik i tillë), dhe për rrjedhojë, Diella të bezdis kur flet ose bën gafa të herëpasherëshme. Po çfarë është intonacioni dhe ç’lidhje ka ai me gjuhën dhe Diellën tonë zadrimore?

  1. Intonacioni dhe shqipja

Intonacioni është një tërësi mjetesh gjuhësore që na ndihmon të kthejmë një grup fjalësh çfarëdo në një thënie me një kuptim të caktuar. Për shembull, marrim grupin e fjalëve më poshtë:

ai zë ngatërrohet shpesh me të tjerët[6]

Në qoftë se e intonojmë me një ngritje kulmore mbi përemrin “ai” ka kuptimin “ai (pra, një frymor i gjinisë mashkullore) zë (fillon) ngatërrohet shpesh me të tjerët”. Ndërsa e intonuar me ngritjen intonative përmbi fjalën “zë”, duke e ndjekur ndoshta dhe nga një pauzë e shkurtër, kuptimi i fjalisë është krejt i ndryshëm nga ai i pari. Fjala “zë“, në këtë rast, nuk është më folje si në kuptimin e parë, por emër. Pra, ai lloj zëri ngatërrohet shpesh me zëra të tjerë.

Për intonacionin në shqip është folur pak (për shembull, Gramatikat e përmendin fare shkarazi, madje në shumicën e tyre nuk figuron fare)[7],[8]. Por, së fundmi, falë një fati fanmirë bashkëpunimi të Institutit të Gjuhësisë në Tiranë me Institutin e Fonetikës dhe Procesimit të Gjuhës në universitetin elitar Ludwig-Maximilian në Mynih kam kryer hetime praktike eksperimentale në laboratorët e tyre të sofistikuar lidhur me natyrën dhe funksionet e intonacionit në shqip, i.e. si prodhohet në rrafshin artikulator, si manifestohet akustikisht, si perceptohet nga dëgjuesit, si dhe sa bashkëvepron me elemente të tjera të prozodisë dhe të gramatikës së shqipes në tërësi[9].

Si për çdo gjuhë, studimet laboratike mësojnë se shqipja nuk është e shtangët sa i takon vijës melodike; dhe se çdo fjalë kodifikohet me një vijë apo konturë melodike të caktuar sipas dëshirës së folësve. Ose po të jemi pak pedantë, këto kontura, të cilat folësit i zgjedhin sipas dëshirës, janë pjesë e kodit të bashkëndarë prej shqipfolësve dhe përmbushin nevoja të caktuara në komunikim. Kështu, këto studime na mësojnë, ndër të tjera, që kur, për arsye të ndryshme komunikative, na duhet të spikatim një fjalë të çfarëdoshme në thënie, kjo spikatje shprehet me një vijë melodike ngritëse dhe zbritëse brenda fjalës së spikatur. Spikatja ndryshon tërësisht kuptimin e thënies. Për shembull, rasti A më poshtë, “Diella flet shqip” mëton pikërisht që “Diella flet shqip” dhe në figurë (spektrogram) vërehet një vijë melodike që ngrihet përgjatë fjalës “Diella”. Ndërsa me spikatje të fjalës “Diella”, fjalia “Diella flet shqip” merr kuptimin “nuk është dikush tjetër që flet shqip, por Diella”. Vija melodike në këtë rast ngrihet dhe zbret brenda fjalës “Diella”. Kështu, vetëm duke modifikuar vijën melodike i kemi dhënë fjalisë një nuancë të re kuptimore të cilën bashkëfolësi ynë e nënkupton falë intonacionit, kontekstit dhe elementeve të tjera jashtëgjuhësore.

  1. Intonacioni te robo-shqipja e Diellës

Të kthehemi te Diella tani, asistentja jonë virtuale. Nga pikëpamja tingullore, Diella i shqipton fjalët e shqipes mjaft mirë, por, megjithatë, identiteti i saj robotik kompromentohet lehtësisht nga mungesa e intonacionit tipik për shqipen. Ja, për shembull, qysh në fillim, kur të përshëndet, përdor një ngritje-zbritje intonacionore tek fjala “unë” jo sikur kërkon të prezantohet, por sikur kërkon të të mbushë mendjen që është ajo asistenti yt virtual, dhe jo dikush tjetër. Po, mirë, por nuk është se ne e vumë në dyshim.

Pastaj të informon me manierën e vet monotone, që me të mund të flasësh tashmë edhe me mesazhe zanore, por edhe këtu, tingëllon, për veshët tanë sot, si folëse me intonacion kaotik. Spikat fjalën “zanore“ pasaktësisht edhe pse konteksti ligjërimor nuk ia lyp këtë nevojë. Në shqip, normalisht, vija melodike përmbi fjalën “zanore“ në fund të thënies këtu do të duhej të ishte thjesht një vazhdim i vijës melodike pakashumë të drejtë mbi fjalën “mesazhe“.

 

I drejtoj pastaj një pyetje me shkrim Diellës (sepse nuk mundem me zë) për mënyrën se si mund të tërheq një çertifikatë martesore. Në përgjigen e saj disasekondëshe gjej sërish gjurmë të një intonacioni të rrëmujshëm që më çorodisin, ndërkohë që mundohem të përthith mesazhin që më kthen me detaje të hollësishme administrative.

Në shembujt e mëposhtëm, do të dëgjoni një rast kur Diella bën një pauzë midis kryefjalës “çerfitikata” dhe kallëzuesit “do të dërgohet”, a thua se është e lodhur, edhe pse ritmi i të folurës së saj i përngjan një hapi ushtarak të mirëmatur dhe të prerë. Mirëpo ky lloj pushimi gjatë të folurit sinjalizon bashkëbiseduesin që mendimi ka mbaruar, është i plotë dhe një mendim i ri pritet të fillojë. Kur mendimi i pambaruar ndahet befas në mes, thënia bëhet e pakuptimshme deri aty.

Në një rast tjetër brenda së njëjtës fjali, Diella vendos që të intonojë me vijë melodike ngritëse trajtën e shkurtër “ju” në togun “ju nevojitet”, ndjekur nga një pauzë e panevojshme, duke e ndarë togun aty ku normalisht nuk do e ndanim kur flasim me njëri tjetrin. Në këtë ilustrim vihen re dukshëm ulje dhe ngritje te panevojshme të melodisë që e bëjnë atë të dallohet si shqipe e panatyrshme dhe disi e bezdisshme.

Provoni të komunikoni me Diellën vetë, përtej mesazhit të saj përshëndetës. Me siguri nuk do ju duhet shumë kohë të gjeni raste të tilla, dhe, patjetër që do ju bjerë në sy që Diella flet shqip jo krejt si ne. Si bashkëbisedues do të duhet të ndaleni disa herë për të ripërpunuar informacionin që merrni duke përllogaritur pauzat e saj të papritura ose ulje-ngritjet e vijës melodike, të cilat në kodin e përbashkët gjuhësor i japin thënies jo kuptimet e pritshme. Kjo ndodh sepse Diella, thënë thjesht, çalon në planifikimin prozodik të thënieve të saj. Kjo jo se e pengon komunikimin krejt, por e vështirëson, nëse me Diellën të duhet të flasësh gjatë.

  1. I takon së ardhmes

Lipset, pra, që me rastin e ardhjes së Diellës në jetët tona, asistentja jonë e parë virtuale në shkallë kombëtare, të bëhet një reflektim për fushën e studimeve mbi prozodinë e shqipes. Natyra e prozodisë dhe funksionet e saj janë të rëndësishme jo vetëm për të krahasuar se si shqipja ndryshon e ngjason tipologjikisht me gjuhë të tjera, qoftë edhe ato brenda lidhjes gjuhësore ballkanike (Balkan Sprachbund) dhe jashtë saj, por edhe për të kuptuar më mirë se si të mundësojmë që sisteme të tilla që përdorin të folme sintetike (angl. synthetic speech), si Diella, t’i përafrohen sistemit natyral të shqipes. Ndryshe nga ç’ndodh me anglishten (e shumë gjuhë të mëdha – me përmasa të mëdha folësish e fondesh për kërkime shkencore), e cila është e studiuar dhe e zbërthyer mirë në të gjitha blloqet që përbëjnë atë që mund ta quajmë “biblioteka e saj e plotë e njësive prozodike në ligjërim”, për shqipen e shumë e shumë gjuhë të tjera, dihet shumë pak.

Dhe më të dishmit prej nesh e kuptojnë që ende nuk e kemi të qartë sistemin e plotë prozodik të shqipes dhe mënyrën se si ndryshon në varësi të gjinisë, të dialektit, të të folmes, të moshës, të arsimit, apo edhe markuesve të tjerë socialë më tranzitorë që lidhen me funksionin ekspresiv të gjuhës, të cilat nuk po i përmend këtu se janë të shumtë. Kjo joshje për të përdorur modelet prozodike të gjuhëve të tjera nga LLM-të (angl. Large Language Models) e përdorura për asistentët virutalë si Diella nuk mund të ushqehet pafundësisht. Në këtë kuptim, ndërmarrja e studimeve të mëtejshme të shqipes në planin prozodik, është në dobi jo vetëm të shkencës albanologjike për arsye thellësisht teorike që lidhen me shqipen, strukturën, historinë dhe mësimin e saj, por edhe në kuptimin aplikativ, për të përsosur robo-shqipen e Diellës dhe të asistentëve të tjerë, të cilët mund të jenë pjesë e jetës tonë tani e në të ardhmen [sigurisht, duke mos lënë pas dore këtu studimin e konteksteve mbi rreziqet që u kanosen përdoruesve nga kjo lloj inteligjence artificiale (voice cloning, etj, etj)]. Mendoni se ç‘mund të ndodhë nëse Diella do ishte asistente virtuale për mësimin e shqipes. Realisht ia vlen dhe duhet të mendojmë e shkruajmë për këtë gjerë e gjatë.

Nëse nuk kam arritur të bind qoftë edhe një lexues për rëndësinë e studimeve mbi prozodinë e shqipes në albanologjinë moderne, shpresoj të paktën që ky pohim i Lumnie Boriçit të shërbejë si nxitje për këtë gjë:

“Funksionet që ushtron intonacioni … janë lehtësisht të dekodueshme brenda një gjuhe të caktuar, çka dëshmon se rrafshi ekspresiv është po aq i kodifikuar dhe i strukturuar sa edhe ai fonematik. Ndryshe s’ka se si të shpjegojmë që njerëzit e një bashkësie gjuhësore të dhënë interpretojnë pa më të voglin gabim, duke i dhënë me saktësi vlerën konvencionale të caktuar në shekuj, çdo ndryshimi intonacionor .., ndërsa kur përpiqet t’i kalojë ato në një gjuhë të huaj, kuptohet për së prapthi.”

 

(c) 2025 Enkeleida Kapia. Të gjitha të drejtat janë të autores.


[1] https://www.sciencedirect.com/science/article/abs/pii/S088523082300006

[2] https://www.uni-bremen.de/fileadmin/user_upload/fachbereiche/fb9/zemki/media/photos/publikationen/working-papers/2020/CoFi_EWP_No-32_Simone-Natale.pdf

[3] https://www.bbc.com/future/article/20241122-ai-deepfakes-is-there-something-special-about-the-human-voice

[4] Krahasimi këtu është thjesht për lehtësi kuptimore. Dua t’i mëshoj fort faktit që modelet e inteligjencës artificiale nuk përshkojnë hapat që ndërmerr pa vetëdije foshnja për të mësuar gjuhën e bashkësisë në të cilën ka lindur e jeton. Në këtë aspekt, këto modele AI të cilat zotërojnë inteligjencë, nuk na zbërthejnë kurrsesi se si njeriu arrin të mësojë gjuhën. Këto dy procese janë shumë të ndryshme nga njëri-tjetri dhe për këtë duhet një artikull më vete.

[5] https://akshi.gov.al/diella-e-albania-tashme-me-asistenten-e-re-virtuale-me-ze-dhe-figure/

[6] Boriçi (1987)

[7] Por lexo Rami Memushaj në veprën e tij Fonetika e Gjuhës Shqipe i cili me intonacion parakupton 5 elemente gjuhësore: 1) melodikën (dmth ngritjen dhe uljen e zërit gjatë të folurit), 2) thekset e ndryshme (theksi i fjalës, theksi i frazës dhe theksi i fjalisë), 3) pauzat të cilat na lejojnë të pushojmë gjatë të folurit, 4) tempoja, pra shpjetësia e të folurit dhe 5) timbri i të folurit që mund të jetë i gëzuar, i frikësuar, etj.

[8] Borici (1987)

[9] https://www.phonetik.uni-muenchen.de/Forschung/interaccent/interAccent.html#publications

1 Koment

  1. Ju përgëzoj për shkrimin! Unë jam i atij mendimi se nëse modeli inteligjent ushqehet me të dhëna zanore më të sakta intonimi do të jetë më natyral. Përderisa gjuhët e mëdha kanë koleksione gjithëpërfshirëse të të folmeve, gjuhës shqipe i mungojnë këto të dhëna. Së paku unë si një i fushës nuk kam mundur ti gjej…

Komentet janë mbyllur.

Zbuloni më tepër nga Peizazhe të fjalës

Pajtohuni tani, që të vazhdoni të lexoni dhe të përfitoni hyrjen te arkivi i plotë.

Vazhdoni leximin