Traducido automaticamente do vasco, a tradución pode conter erros. Máis información aquí. Elhuyarren itzultzaile automatikoaren logoa

Como se utilizou a intelixencia artificial para difundir o eúscaro?

  • Entre eles, Naiara Perez, investigadora do Centro de Tecnoloxía Lingüística HI-TZ da UPV/EHU; Itziar Cortes, investigadora de Elhuyar, e Eli Pombo, xerente de Iametza. Entre outras cousas, falarán sobre o lugar que ten o eúscaro na intelixencia artificial, sobre as súas posibilidades, os retos e as dificultades.
Zarata mediatikoz beteriko garai nahasiotan, merkatu logiketatik urrun eta irakurleengandik gertu dagoen kazetaritza beharrezkoa dela uste baduzu, ARGIA bultzatzera animatu nahi zaitugu. Geroz eta gehiago gara, jarrai dezagun txikitik eragiten.

Está na fala da xente e no día a día utilízase máis a intelixencia artificial do que se cree. Pero que é? “Para dar unha definición simple diría que é un campo entre a matemática e a informática, no que aos computadores dánselles as competencias humanas, como a capacidade lingüística, a vista, o movemento…”, explica Naiara Pérez. A mente pode ser exacta ou xeral. É dicir, o específico serve para algunhas accións, como, por exemplo, acceder a un túnel e acender automaticamente as luces do coche ou preguntar cousas aos auxiliares de voz. Pola contra, o xenérico é algo similar ao ser humano e é capaz de realizar máis dunha acción, como é o caso do interlocutor artificial ChatGPT de Open Ao.

A intelixencia artificial funciona mediante redes neuronais. As redes neuronais tratan de imitar cos instrumentos de computación o sistema nervioso humano e a forma de aprender. Para iso, é necesario informar e deseñar algoritmos de aprendizaxe que capaciten as ferramentas para aprender patróns. “Aínda non chegamos, pero empezamos a expornos realmente si nos próximos anos a intelixencia artificial pode representar á mente dun ser humano”, dixo Pérez.

No entanto, Pombo fixo un comunicado no que lembra que a intelixencia artificial é unha ferramenta: “Non deixaría que nos sedujamos. Debemos utilizar a tecnoloxía de forma racional, para usos realmente útiles e de forma ética”.

Eli Pombo, Iametza: “Sinto que estamos a tentar perder o tren e facer sitio, pero non son pesimista. Á parte das dificultades, creo que tamén temos vento favorable”

A intelixencia artificial pódese aplicar en moitos sectores, entre eles o procesamiento da linguaxe. Neste ámbito inclúense, entre outros, os sistemas de recoñecemento e tradución simultánea da lingua escrita, os sistemas de recepción e escritura da lingua oral e os sistemas de conversión de textos en voz. Segundo Pérez, nos últimos anos no País Vasco hai “moitos” investigadores en tecnoloxía lingüística e desenvolvemento, e hai un sector “forte”: “Estamos a xurdir de nós”. Por tanto, hai un sector que investiga en eúscaro, pero en todo este bulebule da tecnoloxía, cal é o lugar que ten o eúscaro? Que beneficios e inconvenientes ten? Que dificultades e posibilidades ten o eúscaro?

“A intelixencia artificial é a realidade que nos rodea e o eúscaro ten que estar aí. Se non, perde oportunidades na presenza dixital”, subliñou Pombo. Ademais, engadiu que se trata dunha oportunidade para que o eúscaro se estenda a outros lugares. Pérez sumouse a iso e lembrou que as ferramentas de gran proxección, como ChatGPT, adoitan estar en mans de grandes empresas: “Non podemos quedarnos á espera do que vaian facer as grandes empresas. A prioridade de empresas como Google e Microsoft non é ter en conta todos os idiomas do mundo. Este tipo de empresas céntranse nos idiomas con maior número de clientes, é dicir, nas linguas hexemónicas”. Con todo, engadiu que neste tipo de empresas tamén se comezou a integrar o eúscaro.

Pombo sente que os investigadores que traballan en eúscaro neste sentido están “a loitar”: “Sinto que estamos a tentar perder o tren e facer sitio, pero non son pesimista. Á parte das dificultades, creo que tamén temos vento favorable”. Tamén di que hai "moita vontade" de facer as cousas por parte das institucións públicas e da cidadanía. Ademais, segundo Pombo, é “imposible” competir contra os avances que fan as grandes empresas: “Temos que seguir facendo as cousas con sentido común e sen frustrar”.

Elhuyar conta, entre outras, coas ferramentas Elia e Entzun. O tradutor neuronal Elia traduce en poucos segundos textos sinxelos e documentos con formato. A plataforma de expertos procesa arquivos de audio e vídeo previamente gravados e crea as súas transcricións e subtítulos.

Soberanía tecnolóxica Dado que a
tecnoloxía se basea en datos en xeral, Pombo considera que para non pór a información a disposición das grandes empresas é necesario xestionala “de forma soberana”: “O software libre permíteche mellorar o que fixeches por ti e fortalece a economía local”. Neste sentido, Cortés advertiu de que o uso destes datos por parte dos usuarios foi "racional". Por iso, en Elhuyar non se utilizan os datos dos clientes para adestrar as ferramentas: “Temos que estar atentos, non lemos a letra pequena ou non nos avisan e sen querer estamos a alimentar estes sistemas”. Pérez tamén fixo fincapé na orixe dos datos e afirmou que nos modelos libres o aspecto ético é "máis limpo".Tamén subliñaron

o impacto que ten traballar desde as necesidades e aspiracións locais. “Se o facemos nós, crearemos o contido que teñen os temas que nos interesan”, dixo Pérez. Engadiu que a creación de “tecnoloxía punteira” contribúe a “alimentar” ao sector tecnolóxico e ao sector da investigación no País Vasco: “Se traballamos de forma aberta podemos promover a colaboración entre os centros de investigación de aquí”.

Naiara Perez, Centro I.T.: “Non podemos quedarnos á espera do que fagan as grandes empresas. A prioridade de empresas como Google e Microsoft non é ter en conta todos os idiomas do mundo”

Son moitos os que pon a disposición dos demais ferramentas para desenvolver a tecnoloxía. Exemplo diso é o Latxa creado polo Centro de Tecnoloxía Lingüística HiTZ da UPV/EHU. A linguaxe é un gran modelo, e cando se dá unha sucesión de textos a este tipo de modelos, dan a palabra máis probable. “Latxa non fai nada en por si, é un motor que xera outras aplicacións”, explica Pérez. Por exemplo, o corrector ortográfico serve para crear aplicacións de resposta a preguntas e exercicios automáticos no ensino: “Nós, por exemplo, incluímos a Latxa como usuario no xogo Unha vez ao día para dar respostas”. Está dispoñible na rede e pode descargala calquera persoa.

Falta de información, dificultade
Os datos
son o tesouro da intelixencia artificial. De feito, para adestrar as ferramentas necesítanse o maior número de datos de calidade posible. Por exemplo, para crear un sistema que escoite a voz e transcríbea directamente necesítanse moitas gravacións e transcricións. Os investigadores entrevistados han subliñado que unha das grandes dificultades que ten o eúscaro é a obtención de grandes cantidades de datos. “En comparación coas linguas hexemónicas, o eúscaro non ten tanto contido, e entón é máis difícil obter resultados”, dixo Pérez. Iso si, Cortés sumouse a iso, aínda que cre que, en comparación con outras linguas minoritarias, hai "máis" contido en eúscaro.A maioría das

ferramentas actuais están formadas en eúscaro unificado, aínda que tamén existen ferramentas que traballan os dialectos. O servizo de tradución Batua, por exemplo, está baseado na intelixencia artificial e as redes neuronais e é un proxecto desenvolvido polo centro tecnolóxico Vicomtech e promovido por Euskaltel, Mondragonlingua e EITB. Este servizo de tradución coñece o eúscaro batua, o francés, o castelán, o inglés e o biscaíño. Ademais, é capaz de facer traducións entre o eúscaro e todas esas linguas. “No caso dos dialectos vascos é moito máis difícil obter datos; se o eúscaro se custa no batua, pensa no biscaíño ou no labortano”, dixo Pérez. En canto aos dialectos, a falta de normas e as variantes existentes en cada zona dificultan o proceso: “O biscaíño non está unido, entón se alimentamos a máquina cos dialectos de Getxo, Gernika ou Ondarroa, é moi difícil crear un pratón”. A pesar das

dificultades, iso non quere dicir que en Euskal Herria non se xere contido de calidade. De feito, Cortés destacou que se coida "moito" o contido que se xera en eúscaro: “Cos datos que temos estamos a conseguir resultados moi ordenados”. Ademais, engadiu que a intelixencia artificial ha aberto outras portas ao eúscaro, xa que se atopaban "acoutadas" con sistemas antigos. Explica que cos primeiros sistemas non chegaban a crear e pór a disposición sistemas “verdadeiramente útiles”.

Trasladado á práctica explica os avances en tradución automática: “Antes non funcionaba ben, pero agora si”. En 2007 Elhuyar e a UPV crearon Matxin, o primeiro tradutor automático libre. O sistema desta época non estaba baseado na intelixencia artificial: “No caso do eúscaro, os resultados que daba non se achegaban aos que temos hoxe en día. Até 2016 non conseguimos un sistema de calidade para a tradución entre o eúscaro e o castelán”. Na actualidade, Elia é coñecida como o tradutor automático.

Pola contra, no caso doutros idiomas, por exemplo, para as traducións entre o castelán e o galego, na actualidade utilízanse sistemas antigos que aínda non se basean na intelixencia artificial: “Nas linguas máis próximas ou con similitudes obtíñanse moi bos resultados. No caso do eúscaro hai declinaciones, os verbos son diferentes e a orde das palabras é libre. Isto crea dificultades para crear regras de paso dun idioma a outro. Grazas á intelixencia artificial hoxe en día non hai case límites".

Itziar Cortes, Elhuyar: “Se utilizamos o tradutor automático para traducir ao euskera o que non está en eúscaro e non miramos si a tradución está ben, non favorecemos ao eúscaro”

Como a tecnoloxía é
capaz de facer cada vez máis cousas, Cortés cre que hai que ser “razoables”. Pola contra, en lugar de ser un instrumento para a difusión do eúscaro, di que pode ser contraproducente: “Se utilizamos o contido creado en eúscaro para traducilo, estamos a difundir o contido que dalgunha maneira creouse en eúscaro. Pero si utilizamos o tradutor automático para traducir ao euskera o que non está en eúscaro e non miramos si a tradución está ben, non favorecemos ao eúscaro”. Engadiu que isto fará que a medio prazo teñamos textos de “baixa calidade”: “Se utilizamos estes textos para adestrar sistemas de futuro, a calidade do eúscaro será baixa”. Ademais de

revisar o contido que se xera, que se pode facer para garantir a calidade? O Centro de Tecnoloxía Lingüística HiTZ adoptou varias vías para iso. En primeiro lugar, utilizáronse os contidos dos medios de comunicación vascos con licenza Creative Commons. Debido a que estes datos non son suficientes, tamén se recorreu aos grandes arquivos e filtrouse o seu contido a través dun filtro. “Conseguimos 4.000.000 de documentos, pero non é suficiente para crear unha ferramenta como ChatGPT; con todo, conseguimos bos resultados”.

Outro exemplo son as ferramentas Elia, Entzun e TTS que ten Elhuyar. O tres baséanse na intelixencia artificial. O tradutor neuronal Elia traduce en poucos segundos textos sinxelos e documentos con formato. A plataforma de expertos procesa arquivos de audio e vídeo previamente gravados e crea as súas transcricións e subtítulos. O neuronal TTS converte o texto en voz. As tecnoloxías de Elhuyar coñecen o eúscaro, o castelán, o francés, o inglés, o catalán e o galego. Isto significa que Elia, Entzun e TTS pódense utilizar neses seis idiomas. É a última novidade de Elhuyar: “Habemos visto que os clientes son multilingües e que queren utilizar a nosa tecnoloxía noutros idiomas diferentes ao eúscaro. Tendo o eúscaro como eixo principal, poden utilizar a única ferramenta en máis idiomas”.

Elhuyar zientzia.eus ten integrado na súa web ao tradutor neuronal. Nota: “Texto escrito en eúscaro e traducido automaticamente a través de Elia, sen supervisión posterior”. Neste exemplo o texto aparece en catanata.

Cortés cre que todas estas ferramentas poden axudar a “ampliar” o eúscaro: “Non temos que ter medo a crear en eúscaro. Se queremos chegar a máis xente, ademais dos tradutores profesionais, hoxe en día temos moitas ferramentas”. En Elhuyar, por exemplo, a maioría das veces crean cousas en eúscaro, pero traducen algunhas cousas fóra de Euskal Herria cun tradutor automático. Sempre avisando ao usuario e ofrecendo a posibilidade de acceder á versión orixinal.Por exemplo

, no portal zientzia.eus teñen un tradutor automático integrado. Isto significa que se unha persoa pon en Internet o sistema Como xurdiu ou solar? -Como xurdiu o sistema solar? en galego–, que se pode acceder ao portal zientzia.eus. Na páxina web ofrécese a posibilidade de ler noutro idioma e ver a versión orixinal. “Temos claro que o lector ten que saber que é un texto feito por un tradutor automático, e non por unha persoa”, dixo Cortés.

ARGIA participou recentemente no proxecto Itzulinguru e, do mesmo xeito que a web zientzia.eus, integrou ao tradutor automático no experimento proposto polo Cluster de Sociolingüística e o grupo de investigación Innoklab da UPV/EHU. Este proxecto contou coa participación de: Elhuyar, AEK, Orai, Centro de Intelixencia Artificial, Osakidetza, Departamento de Educación do Goberno Vasco e Hekimen.Aínda que usan o

tradutor automático, non deixan todo en mans das ferramentas. Os membros de Elhuyar repasan o contido para garantir a súa calidade. Ás veces son os investigadores e outras os tradutores profesionais: “Nós témolo claro: necesítanse tradutores profesionais porque co automático non conséguese o 100% da calidade. Ademais, non podes deixar a calquera que saiba si un texto é bo ou non, porque non todos temos os mesmos criterios”. Todos estes instrumentos e recursos que existen na

actualidade poden axudar á aprendizaxe de idiomas. Con todo, que ocorre si, en lugar de espertar as ganas de aprender, fan que non teñan ganas de aprender o idioma? Segundo Pérez, aínda que o desexo ou a necesidade de aprender unha lingua está ligado á necesidade de comunicar, non se limita a iso: “No que respecta ao eúscaro, non creo que ninguén aprenda a comunicarse por si só. É unha elección e hai moitas cousas máis cerca. Realmente, se queres aprender euskera, francés, árabe ou calquera idioma, este tipo de ferramentas facilitaranche o camiño, pero un tradutor non darache o pracer de ler en eúscaro directamente”.


Interésache pola canle: Adimen artifiziala
2024-06-21 | Sustatu
Trampa nun concurso de imaxes AA con foto real
Nun concurso de fotografía baseado en Internet, en 1839 Cor Photography Awards, prodúcese unha trampa. Crearon unha categoría especial para a edición de 2024, na que presentaban imaxes de Intelixencia Artificial, e o gañador fixo unha trampa, un premio que gañou... [+]

A metade dos alumnos da ESO utiliza a intelixencia artificial para realizar os traballos escolares, segundo unha enquisa
O 97% dos estudantes de Educación Secundaria Obrigatoria utilizou intelixencia artificial. Utilízano para buscar información, para escribir, para facer traballos en casa ou para responder a preguntas do exame. Informan dos datos e inquietudes da enquisa realizada a 1.006... [+]

Israel deixa o asasinato dos palestinos en mans da intelixencia artificial
Lese ao titular e alguén pensa que se trata dunha esaxeración, unha generalización excesiva do xornalista. 'Lavender': The AI machine directing Israel's bombing spree in Gaza (Máquina de intelixencia artificial que dirixe a campaña de bombardeo de Israel en Gaza). Son as... [+]

2024-04-17 | Reyes Ilintxeta
Elisabeth Pérez. Defensor da creación
"A Intelixencia Artificial é unha ferramenta de futuro, pero a súa esencia é roubar creacións do pasado"
Coñecín o labor dos creadores Elisabeth no congreso de librarías celebrado en marzo en Pamplona, defendendo con paixón a Intelixencia Artificial creativa. Pouco despois quedámonos para entrevistarnos antes de ir á Feira do Libro de Bolonia e a Colombia. Recoñezo que... [+]

Están os dereitos civís en perigo en Europa?

O 8 de decembro de 2023, a Unión Europea (UE) aprobou a primeira regulación integral da intelixencia artificial, pero segundo un documento interno adquirido polo semanario Político "posibilítase un uso irresponsable e desproporcionado da tecnoloxía de identificación... [+]


Novas formas de violencia dixital: Pornografía sintética non aceptada

Na era dixital, cada vez temos máis exemplos de como a tecnoloxía afecto á intimidade humana e estanse producindo fenómenos alarmantes. Última pornografía sintética non aceptada. Este termo refírese á manipulación de imaxes ou vídeos mediante intelixencia artificial... [+]


Tecnoloxía
Guiado pola eficiencia

Na miña época de estudante ensináronme a diferenza que había detrás da palabra eficacia e eficiencia. Naquela época a eficiencia parecíame un obxectivo, hoxe non estou tan seguro. A eficiencia grazas ás transformacións dixitais reportounos moitos beneficios, polo menos... [+]


O Parlamento Europeo aproba a Lei de Intelixencia Artificial
O Parlamento aprobou o mércores unha lei de intelixencia artificial que asegura a seguridade e o respecto aos dereitos fundamentais, á vez que impulsa a innovación.

Traballos domésticos de Historia na era da Intelixencia Artificial

Non fai moito tivemos unha reunión de profesores da universidade na que o ambiente de preocupación imperaba polos cambios que a Intelixencia Artificial (IA) produciu no ensino da historia. E é que os seus compañeiros non sabían que responder ante este desenvolvemento... [+]


Yuk Hui. Cantas cabezas, diferentes tecnoloxías
"Non creo que poidamos conseguir un mundo máis xusto recollendo máis datos"
O pasado mes de xaneiro o filósofo Yuk Hui ofreceu unha conferencia, mellor dito, na Tabakalera de Donostia. A súa obra tivo unha gran repercusión nos últimos anos e encheuse de altura. Hui criticou, entre outras cousas, a liña de pensamento do monotecnología, que podería... [+]

Que a fascinación pola tecnoloxía non cegue a educación
Recibimos a clase maxistral de expertos Pablo Garaizar e Diana Franco: “Os espazos sen tecnoloxía son necesarios”.

Adrián Almazán
"Coa lóxica algorítmica da sociedade seguiremos explotando aos seres humanos"
Licenciado en Física e doutor en Filosofía, Adrián Almazán (Madrid, 1990) ten a súa residencia habitual en Vitoria, pero actualmente imparte clases na Universidade Carlos III de Madrid. Analiza os efectos da dixitalización sobre o medio ambiente, a enerxía e a sociedade e... [+]

2024-02-21 | Reyes Ilintxeta
Mikel Galar. Intelixente natural
"Debemos ter coidado ao dar os datos, pero sen convertelos en paranoicos"
A intelixencia artificial (IA) é o campo da informática que se orienta a crear sistemas que poidan realizar tarefas como aprendizaxe, razoamento ou percepción que requiren intelixencia humana. O profesor e investigador pamplonés Mikel Galar, experto e experto niso, deunos... [+]

Eguneraketa berriak daude