“Proiektu honek berez ez du hizkuntza ‘salbatuko’, baina espero dut norabide egokian urrats bat eman izana”

  • Alexandru Jerpelea Bukaresteko (Errumania) batxilergoko 17 urteko ikaslea da, eta itzulpen automatikoko lehen sistema neuronala sortu du arrumanorako. Balkanetan 200.000 pertsona inguruk hitz egiten duten hizkuntza erromaniko gutxitua da. Bere tresna berritzaileak, AroTranslate.com orriaren bidez eskura daitekeenak, arrumanoa-errumaniera, arrumanoa-ingelesa eta ingelesa-errumaniera hizkuntzen artean itzultzeko aukera ematen du. Hizkuntza gutxituek ingurune digitalean duten presentzia bermatzeaz arituko da Donostian egingo den Hizkuntzen Irabazia kongresuan, azaroaren 26an. Hemen kongresuaren webgunea.

Artikulu hau CC BY 4.0 lizentziari esker ekarri dugu.
Artikulu hau CC BY 4.0 lizentziari esker ekarri dugu.

2024ko azaroaren 20an - 11:55
Azken eguneraketa: 2024-11-21 14:35

Hizkuntzalaritza konputazionalari eskaini dion dedikazioak arreta nazionala erakarri du Errumanian, eta komunikabideek bere lan berritzailearen berri eman nahi izan dute. Elkarrizketa honetan, Alexandruk bere proiektuaren atzean dagoen inspirazioaz hitz egiten digu, aurre egin beharreko erronkez eta bere proiektuak arrumanoaren kontserbaziorako duen garrantziaz.

Alexandru, azalduko zeniguke labur zer asmatu duzun zehazki eta zein onura dakarzkion hizkuntza arrumanoari?

Bukaresteko Unibertsitateko kide den Sergiu Nisioi, eta Errumaniako eta beste herrialde batzuetako komunitate arrumanoaren laguntzarekin –bereziki Florentina Costearen laguntzarekin– arrumanorako itzulpen automatikoko lehen sistema neuronala sortu genuen. Ekialdeko hizkuntza erromantze bat da. Proiektua gauzatzeko, 80.000 errumaniar-arrumano esaldi pare baino gehiagoko datu-multzo bat sortu behar izan genituen. Datuak hainbat iturritatik jaso eta arrumanora egokitutako datu-bilketa prozesu baten bidez egin genuen. AAn oinarritutako itzulpen-tresna honek arrumanoa eskuragarriago egin nahi du. Proiektuaren xehetasun tekniko gehiago aurkituko dituzu gure argitalpenean.

Zertan oinarritu zinen arrumanoaren lehen itzulpen automatikoko sistema garatzeko?

Hizkuntzalaritza konputazionaleko ikasketetan eta galzorian zeuden hizkuntzen itzulpen automatikoko beste proiektu batzuetan inspiratu nintzen, hala nola samian eta txerokian. Beste hizkuntza batzuetarako egin diren ahalegin horiek ikusteak arrumanorako antzeko zerbait sortzera bultzatu ninduen.

Zer garrantzia du zuretzat arrumanoa zaintzeko hain modu esanguratsuan laguntzeak?

Harro nago proiektu honek arrumanoaren kontserbazioari buruz atentzioa eman duelako. Interneteko artikuluak eta sare sozialetako argitalpenak lagungarri izaten ari dira jendea kontzientziatzeko. Mundu akademikoan, espero dut gure corpusak arrumanoaren digitalizazioari buruzko ikerketa gehiago bultzatzea. Gure proiektua aurrerapauso nabarmena bada ere, mugak dituen prototipoa da, eta arrumanoak erronka askori egin behar die aurre oraindik. Nahiz eta proiektu honek berez ez duen hizkuntza "salbatuko", espero dut norabide egokian urrats bat eman izana.

Zer zailtasun izan dituzu itzulpen sistema hau garatzeko orduan?

Erronka handiena datuak biltzea izan zen. Gure corpusa (datu multzoa) mota honetako handiena bada ere, nahiko txikia izaten jarraitzen du baliabide maila handiko hizkuntzekin alderatuta, milioika edo milaka milioi esalditako datu multzoak izaten baitituzte. Gure helburua zabaltzen eta hobetzen jarraitzea da.

Zer erreakzio jaso dituzu arrumanoaren komunitatetik zure asmakizunari dagokionez? Nola erreakzionatu dute Errumaniako komunikabideek lan honen aurrean?

Komunitate arrumanoa oso gogotsu agertu da eta programaren akatsen inguruko iruzkin konstruktiboak eskaini ditu, oso baliotsuak izan direnak. Errumaniako komunikabide nagusiek gure proiektuaren berri eman zuten, eta horrek gogo bizia sortu zuen arrumano hiztunak ez direnen artean ere. Hizkuntzaren egoera ezagutzen ez zuten pertsonen mezuak jaso genituen, eta arrumanoaren erronkei buruz kontzientziatzen lagundu izanak poztu egiten gaitu.

Zer zeregin dituzu hizkuntza-teknologiarekin lotutako etorkizuneko proiektuetarako?

Datorren urtean, unibertsitatean hasiko naiz. Han, Hizkuntza Naturalaren Prozesamendua ikasten jarraituko dut eta baliabide gutxiko hizkuntzetarako proiektu gehiago egiten lagunduko dut. Unibertsitateko onarpen prozesua amaitzen denean, berriz jarraituko dut arrumanorako itzulpen sistema garatzen.


Kanal honetatik interesatuko zaizu: Hizkuntza gutxituak
Bretoierak hiztunen erdia galdu du sei urtean, azken ikerketaren arabera

Bretainian, bretoiera oso ondo edo nahiko ondo hitz egiten duten herritarrak %2,7 dira, 2018an baino hiru puntu gutxiago. 107.000 dira gaur egun. Hiztunak gazteagoak dira. Galo hiztunen kopuruak ere behera egin du, baina ez bretoierak bezainbesteko abiadan.


Alex Pancho Robles, hizkuntza aktibista guarania
“Guarania patronatuta egon da, kartzelatuta, esklabotuta”

Garabidek antolaturik, Hizkuntzak Biziberritzeko Formazio Programaren barruan izan zen gurean Alex Pancho Robles (Camiri, Bolivia, 1995) iragan urrian. Guarania da, eta guaraniera hiztuna. 8 milioi hiztun inguru dira Bolivia, Brasil, Argentina eta Paraguain barrena, hizkuntza... [+]


Erizain indigenek herri zapalduentzat ekitatezko osasun zerbitzua aldarrikatu dute

Garbiñe Elizegi baztandarra erizaina da. Abenduan, Zeelanda Berrian egin duten Osasun Ekitaterako Erizaintza Indigenari buruzko Ikerketa izenburuko bilkuran hartu du parte. Bere tesia aurkeztu du: Euskal emakumeek eta genero ez-normatiboek Euskal Herrian osasungintzan... [+]


2024-12-19 | Leire Ibar
Frantziak hizkuntza gutxituen aurka darabilen “linguizidioa” salatu dute

Hizkuntza gutxituei begira Frantziaren jarrera salatzeko prentsaurreko bat egin dute Parisen hainbat diputatuk. Frantziako hizkuntza gutxituen kontrako azken erasoek protestak eragin dituzte Korsikan, Katalunian eta Martinikan. Régions et Peuples Solidaires mugimenduak... [+]


Ipar Kataluniako udaletan katalana erabiltzea debekatu du Frantziako justiziak

Okzitaniako Tolosako Apelazio epaitegiak eman du epaia, eta horren arabera, udaletan ezingo da katalana lehen hizkuntza moduan erabili, eta izatekotan, frantsesez egin ondoren, hura katalanera itzuli ahal izango da.


Samira Belyouaou, amazigera hiztuna
“Ni, diasporako alaba, neure buruaren kontra borrokan bizi nintzen Alemanian”

Samira Belyouaou (Heidelberg, Alemania, 1994) diasporako alaba da. Gurasoak Rifen (Maroko) jaioak, Alemanian Samira alabak eta lau seme-alaba gehiagok amazigera izan zuten etxeko hizkuntza. Itzulpengintza ikasketak egina, software enpresa batean ari da, beren produktuak 80... [+]


2024-11-27 | ARGIA
Korsikako Asanblean frantsesa inposatzen jarraitzen dute, korsikera debekatuta

Korsikako legebiltzarkideek ezin dute Korsikako Asanblean korsikeraz hitz egin, Bastiako Auzitegiaren 2023ko epai baten arabera. Ebazpen horri helegitea jarri zion Asanbleak, baina debekua berretsi du orain auzitegi berak. Epaiak tokiko beste hizkuntzei eragiten diela ohartarazi... [+]


2024-11-22 | ARGIA
Languneko zuzendari Lohitzune Txarola
“Hizkuntza gutxituen pisu ekonomiko eta estrategikoa aldarrikatu nahi du Langunek”

Azaroaren 26an eta 27an, Langune Euskal Herriko Hizkuntza Industrien Elkarteak eta FUEN Federal Union of European Nationalities erakundeak antolatuta, ‘Hizkuntzen irabazia. Benefits of language industry in the economy’ kongresua egingo da Donostiako Kursaalean. Han... [+]


2024-11-18 | Leire Ibar
Hizkuntza gutxituek ingurune digitalean duten presentzia bermatzeaz arituko dira Donostian egingo den kongresuan

Hizkuntzen irabazia kongresua izango da azaroaren 26an eta 27an Donostian. Arlo digitalean inglesaren erabilera aregotzen ari den garaietan, kongresuak euskara bezalako hizkuntza gutxituek tokiko ekonomiari egiten dioten ekarpena agerian utzi nahi du.


MICEk ordezkatuko du Euskal Herria hizkuntza gutxituen ‘Eurovision’ moduko jaialdiaren finalean

Friulieraz egiten duen irrati lokal bat da Suns Europe jaialdiaren antolatzailea eta berak egiten du zuzeneko jarraipena. Miren Narbaiza MICE ariko da oholtza gainean, Euskal Herria ordezkatzen.


Sua-sua

Uwa, kamsá, tukuná, uitoto, tikuna, embera, nasa-yuwe, nukak, sikuani, siano, macuna, yuruti, kichwa, achagua, bora, ettenaka. Horiek dira Kolonbian hitz egiten diren hizkuntzetako batzuk. Tamalez, Kolonbian bizi nintzenean, Cundinamarcan, nik ez nuen gure... [+]


Wikipediaren hizkuntza gutxituen biltzar batean bizitakoak

Lanopor egun batzuk izan nituen joan den astean. Oporrak ziren, baina ordu batzuk dedikatzen dizkiodan afizio bati emanak izan ziren, biltzar batean inbertituak: hotelean lo eta hotel bereko areto batean jardunaldiak goiz eta arratsaldez. Ordu gutxi batzuk geratzen ziren hiria... [+]


Mister Spanishen ehorzketa

Marfa (AEB), 1954. Texasko basamortuko herri horretako Blackwell lehen hezkuntzako eskolan haurrak zeremonia berezi batean parte hartzera behartu zituzten. Irakasleek paper zatiak banatu zizkieten eta bertan zera idazteko eskatu: “Ez dut espainieraz hitz egingo, ez... [+]


Eguneraketa berriak daude