Alexandru Jerpelea, estudiant de 17 anys de batxillerat a Bucarest (Romania), ha creat el primer sistema neuronal de traducció automàtica per a la rumanía. Es tracta d'una llengua romànica minoritzada que parlen als Balcans prop de 200.000 persones. La seva innovadora eina, disponible a través de la pàgina Arotranslate.com, permet traduir l'arrumano-romanès, l'arrumano-anglès i l'anglès-romanès entre els idiomes.
La seva dedicació a la lingüística computacional ha atret l'atenció nacional a Romania, i els mitjans de comunicació han volgut donar a conèixer el seu treball innovador. En aquesta entrevista, Alexandru ens parla de la inspiració que hi ha darrere del seu projecte, dels reptes als quals s'enfronta i de la importància del seu projecte per a la conservació de l'arrumano.
Alexandru, podria dir-nos breument què és el que ha inventat exactament i quins beneficis aporta a la llengua arrumana?
Amb l'ajuda de Sergiu Nisioi, membre de la Universitat de Bucarest, i de la comunitat arrumana de Romania i d'altres països, especialment amb l'ajuda de Florentina Costa, creem el primer sistema neuronal de traducció automàtica a l'arrumano. La llengua oriental és un romanç. Per a dur a terme el projecte, vam haver de crear un conjunt de dades amb més de 80.000 parells de frases romanès-arrumanas. Vam recollir les dades de diferents fonts i ho vam fer a través d'un procés de recollida de dades adaptat a l'arrumano. Aquesta eina de traducció basada en la IA pretén fer més accessible l'arrumano. Trobaràs més detalls tècnics del projecte en la nostra publicació.
En què et vas basar per a desenvolupar el primer sistema de traducció automàtica de l'arrumano?
Em vaig inspirar en els estudis de lingüística computacional i en altres projectes de traducció automàtica de llengües en perill d'extinció, com el sami i el cheroki. L'observació dels esforços realitzats en altres idiomes em va impulsar a crear alguna cosa semblança per a l'arrumano.
Quina importància té per a vostè ajudar-lo d'una manera tan significativa per a cuidar l'arrumano?
Estic orgullós que aquest projecte hagi cridat l'atenció sobre la conservació de l'arrumano. Els articles d'Internet i les publicacions en xarxes socials estan ajudant a conscienciar a la gent. En el món acadèmic, espero que el nostre corpus promogui més recerques sobre la digitalització de l'arrumano. A pesar que el nostre projecte és un gran avanç, és un prototip que té fronteres i el romanès encara ha de fer front a molts reptes. A pesar que aquest projecte en si mateix no salvarà "" la llengua, espero que hagi fet un pas en la bona direcció.
Quines dificultats has tingut a l'hora de desenvolupar aquest sistema de traducció?
El major repte va ser la recollida de dades. Encara que el nostre corpus (conjunt de dades) és el més gran d'aquest tipus, continua sent relativament petit en comparació amb les llengües de major nivell de recursos, ja que contenen conjunts de dades de milions o milers de milions de frases. El nostre objectiu és continuar ampliant i millorant.
Quines reaccions ha rebut de la comunitat d'arrumano en relació a la seva invenció? Com han reaccionat els mitjans romanesos davant aquest treball?
La comunitat arrumana s'ha mostrat molt activa i ha ofert comentaris constructius sobre els errors del programa, que han estat molt valuosos. Els principals mitjans de comunicació romanesos van donar a conèixer el nostre projecte, la qual cosa va suscitar entusiasme fins i tot entre els quals no són arrumanos parlants. Rebem missatges de persones que desconeixien l'estat de la llengua, i ens alegra haver contribuït a conscienciar sobre els reptes de l'arrumano.
Quines tasques té per a futurs projectes relacionats amb la tecnologia lingüística?
L'any que ve començaré en la universitat. Allí continuaré estudiant Processament del Llenguatge Natural i col·laboraré en la realització de més projectes per a les llengües amb menys recursos. Quan acabi el procés d'admissió en la universitat, continuaré desenvolupant el sistema de traducció per al romanès.