Alexandru Jerpelea Bukaresteko (Errumania) batxilergoko 17 urteko ikaslea da, eta itzulpen automatikoko lehen sistema neuronala sortu du arrumanorako. Balkanetan 200.000 pertsona inguruk hitz egiten duten hizkuntza erromaniko gutxitua da. Bere tresna berritzaileak, AroTranslate.com orriaren bidez eskura daitekeenak, arrumanoa-errumaniera, arrumanoa-ingelesa eta ingelesa-errumaniera hizkuntzen artean itzultzeko aukera ematen du. Hizkuntza gutxituek ingurune digitalean duten presentzia bermatzeaz arituko da Donostian egingo den Hizkuntzen Irabazia kongresuan, azaroaren 26an. Hemen kongresuaren webgunea.
Hizkuntzalaritza konputazionalari eskaini dion dedikazioak arreta nazionala erakarri du Errumanian, eta komunikabideek bere lan berritzailearen berri eman nahi izan dute. Elkarrizketa honetan, Alexandruk bere proiektuaren atzean dagoen inspirazioaz hitz egiten digu, aurre egin beharreko erronkez eta bere proiektuak arrumanoaren kontserbaziorako duen garrantziaz.
Alexandru, azalduko zeniguke labur zer asmatu duzun zehazki eta zein onura dakarzkion hizkuntza arrumanoari?
Bukaresteko Unibertsitateko kide den Sergiu Nisioi, eta Errumaniako eta beste herrialde batzuetako komunitate arrumanoaren laguntzarekin –bereziki Florentina Costearen laguntzarekin– arrumanorako itzulpen automatikoko lehen sistema neuronala sortu genuen. Ekialdeko hizkuntza erromantze bat da. Proiektua gauzatzeko, 80.000 errumaniar-arrumano esaldi pare baino gehiagoko datu-multzo bat sortu behar izan genituen. Datuak hainbat iturritatik jaso eta arrumanora egokitutako datu-bilketa prozesu baten bidez egin genuen. AAn oinarritutako itzulpen-tresna honek arrumanoa eskuragarriago egin nahi du. Proiektuaren xehetasun tekniko gehiago aurkituko dituzu gure argitalpenean.
Zertan oinarritu zinen arrumanoaren lehen itzulpen automatikoko sistema garatzeko?
Hizkuntzalaritza konputazionaleko ikasketetan eta galzorian zeuden hizkuntzen itzulpen automatikoko beste proiektu batzuetan inspiratu nintzen, hala nola samian eta txerokian. Beste hizkuntza batzuetarako egin diren ahalegin horiek ikusteak arrumanorako antzeko zerbait sortzera bultzatu ninduen.
Zer garrantzia du zuretzat arrumanoa zaintzeko hain modu esanguratsuan laguntzeak?
Harro nago proiektu honek arrumanoaren kontserbazioari buruz atentzioa eman duelako. Interneteko artikuluak eta sare sozialetako argitalpenak lagungarri izaten ari dira jendea kontzientziatzeko. Mundu akademikoan, espero dut gure corpusak arrumanoaren digitalizazioari buruzko ikerketa gehiago bultzatzea. Gure proiektua aurrerapauso nabarmena bada ere, mugak dituen prototipoa da, eta arrumanoak erronka askori egin behar die aurre oraindik. Nahiz eta proiektu honek berez ez duen hizkuntza "salbatuko", espero dut norabide egokian urrats bat eman izana.
Zer zailtasun izan dituzu itzulpen sistema hau garatzeko orduan?
Erronka handiena datuak biltzea izan zen. Gure corpusa (datu multzoa) mota honetako handiena bada ere, nahiko txikia izaten jarraitzen du baliabide maila handiko hizkuntzekin alderatuta, milioika edo milaka milioi esalditako datu multzoak izaten baitituzte. Gure helburua zabaltzen eta hobetzen jarraitzea da.
Zer erreakzio jaso dituzu arrumanoaren komunitatetik zure asmakizunari dagokionez? Nola erreakzionatu dute Errumaniako komunikabideek lan honen aurrean?
Komunitate arrumanoa oso gogotsu agertu da eta programaren akatsen inguruko iruzkin konstruktiboak eskaini ditu, oso baliotsuak izan direnak. Errumaniako komunikabide nagusiek gure proiektuaren berri eman zuten, eta horrek gogo bizia sortu zuen arrumano hiztunak ez direnen artean ere. Hizkuntzaren egoera ezagutzen ez zuten pertsonen mezuak jaso genituen, eta arrumanoaren erronkei buruz kontzientziatzen lagundu izanak poztu egiten gaitu.
Zer zeregin dituzu hizkuntza-teknologiarekin lotutako etorkizuneko proiektuetarako?
Datorren urtean, unibertsitatean hasiko naiz. Han, Hizkuntza Naturalaren Prozesamendua ikasten jarraituko dut eta baliabide gutxiko hizkuntzetarako proiektu gehiago egiten lagunduko dut. Unibertsitateko onarpen prozesua amaitzen denean, berriz jarraituko dut arrumanorako itzulpen sistema garatzen.