Traducido automaticamente do vasco, a tradución pode conter erros. Máis información aquí. Elhuyarren itzultzaile automatikoaren logoa

Como se utilizou a intelixencia artificial para difundir o eúscaro?

  • Entre eles, Naiara Perez, investigadora do Centro de Tecnoloxía Lingüística HI-TZ da UPV/EHU; Itziar Cortes, investigadora de Elhuyar, e Eli Pombo, xerente de Iametza. Entre outras cousas, falarán sobre o lugar que ten o eúscaro na intelixencia artificial, sobre as súas posibilidades, os retos e as dificultades.

Está na fala da xente e no día a día utilízase máis a intelixencia artificial do que se cree. Pero que é? “Para dar unha definición simple diría que é un campo entre a matemática e a informática, no que aos computadores dánselles as competencias humanas, como a capacidade lingüística, a vista, o movemento…”, explica Naiara Pérez. A mente pode ser exacta ou xeral. É dicir, o específico serve para algunhas accións, como, por exemplo, acceder a un túnel e acender automaticamente as luces do coche ou preguntar cousas aos auxiliares de voz. Pola contra, o xenérico é algo similar ao ser humano e é capaz de realizar máis dunha acción, como é o caso do interlocutor artificial ChatGPT de Open Ao.

A intelixencia artificial funciona mediante redes neuronais. As redes neuronais tratan de imitar cos instrumentos de computación o sistema nervioso humano e a forma de aprender. Para iso, é necesario informar e deseñar algoritmos de aprendizaxe que capaciten as ferramentas para aprender patróns. “Aínda non chegamos, pero empezamos a expornos realmente si nos próximos anos a intelixencia artificial pode representar á mente dun ser humano”, dixo Pérez.

No entanto, Pombo fixo un comunicado no que lembra que a intelixencia artificial é unha ferramenta: “Non deixaría que nos sedujamos. Debemos utilizar a tecnoloxía de forma racional, para usos realmente útiles e de forma ética”.

Eli Pombo, Iametza: “Sinto que estamos a tentar perder o tren e facer sitio, pero non son pesimista. Á parte das dificultades, creo que tamén temos vento favorable”

A intelixencia artificial pódese aplicar en moitos sectores, entre eles o procesamiento da linguaxe. Neste ámbito inclúense, entre outros, os sistemas de recoñecemento e tradución simultánea da lingua escrita, os sistemas de recepción e escritura da lingua oral e os sistemas de conversión de textos en voz. Segundo Pérez, nos últimos anos no País Vasco hai “moitos” investigadores en tecnoloxía lingüística e desenvolvemento, e hai un sector “forte”: “Estamos a xurdir de nós”. Por tanto, hai un sector que investiga en eúscaro, pero en todo este bulebule da tecnoloxía, cal é o lugar que ten o eúscaro? Que beneficios e inconvenientes ten? Que dificultades e posibilidades ten o eúscaro?

“A intelixencia artificial é a realidade que nos rodea e o eúscaro ten que estar aí. Se non, perde oportunidades na presenza dixital”, subliñou Pombo. Ademais, engadiu que se trata dunha oportunidade para que o eúscaro se estenda a outros lugares. Pérez sumouse a iso e lembrou que as ferramentas de gran proxección, como ChatGPT, adoitan estar en mans de grandes empresas: “Non podemos quedarnos á espera do que vaian facer as grandes empresas. A prioridade de empresas como Google e Microsoft non é ter en conta todos os idiomas do mundo. Este tipo de empresas céntranse nos idiomas con maior número de clientes, é dicir, nas linguas hexemónicas”. Con todo, engadiu que neste tipo de empresas tamén se comezou a integrar o eúscaro.

Pombo sente que os investigadores que traballan en eúscaro neste sentido están “a loitar”: “Sinto que estamos a tentar perder o tren e facer sitio, pero non son pesimista. Á parte das dificultades, creo que tamén temos vento favorable”. Tamén di que hai "moita vontade" de facer as cousas por parte das institucións públicas e da cidadanía. Ademais, segundo Pombo, é “imposible” competir contra os avances que fan as grandes empresas: “Temos que seguir facendo as cousas con sentido común e sen frustrar”.

Elhuyar conta, entre outras, coas ferramentas Elia e Entzun. O tradutor neuronal Elia traduce en poucos segundos textos sinxelos e documentos con formato. A plataforma de expertos procesa arquivos de audio e vídeo previamente gravados e crea as súas transcricións e subtítulos.

Soberanía tecnolóxica Dado que a
tecnoloxía se basea en datos en xeral, Pombo considera que para non pór a información a disposición das grandes empresas é necesario xestionala “de forma soberana”: “O software libre permíteche mellorar o que fixeches por ti e fortalece a economía local”. Neste sentido, Cortés advertiu de que o uso destes datos por parte dos usuarios foi "racional". Por iso, en Elhuyar non se utilizan os datos dos clientes para adestrar as ferramentas: “Temos que estar atentos, non lemos a letra pequena ou non nos avisan e sen querer estamos a alimentar estes sistemas”. Pérez tamén fixo fincapé na orixe dos datos e afirmou que nos modelos libres o aspecto ético é "máis limpo".Tamén subliñaron

o impacto que ten traballar desde as necesidades e aspiracións locais. “Se o facemos nós, crearemos o contido que teñen os temas que nos interesan”, dixo Pérez. Engadiu que a creación de “tecnoloxía punteira” contribúe a “alimentar” ao sector tecnolóxico e ao sector da investigación no País Vasco: “Se traballamos de forma aberta podemos promover a colaboración entre os centros de investigación de aquí”.

Naiara Perez, Centro I.T.: “Non podemos quedarnos á espera do que fagan as grandes empresas. A prioridade de empresas como Google e Microsoft non é ter en conta todos os idiomas do mundo”

Son moitos os que pon a disposición dos demais ferramentas para desenvolver a tecnoloxía. Exemplo diso é o Latxa creado polo Centro de Tecnoloxía Lingüística HiTZ da UPV/EHU. A linguaxe é un gran modelo, e cando se dá unha sucesión de textos a este tipo de modelos, dan a palabra máis probable. “Latxa non fai nada en por si, é un motor que xera outras aplicacións”, explica Pérez. Por exemplo, o corrector ortográfico serve para crear aplicacións de resposta a preguntas e exercicios automáticos no ensino: “Nós, por exemplo, incluímos a Latxa como usuario no xogo Unha vez ao día para dar respostas”. Está dispoñible na rede e pode descargala calquera persoa.

Falta de información, dificultade
Os datos
son o tesouro da intelixencia artificial. De feito, para adestrar as ferramentas necesítanse o maior número de datos de calidade posible. Por exemplo, para crear un sistema que escoite a voz e transcríbea directamente necesítanse moitas gravacións e transcricións. Os investigadores entrevistados han subliñado que unha das grandes dificultades que ten o eúscaro é a obtención de grandes cantidades de datos. “En comparación coas linguas hexemónicas, o eúscaro non ten tanto contido, e entón é máis difícil obter resultados”, dixo Pérez. Iso si, Cortés sumouse a iso, aínda que cre que, en comparación con outras linguas minoritarias, hai "máis" contido en eúscaro.A maioría das

ferramentas actuais están formadas en eúscaro unificado, aínda que tamén existen ferramentas que traballan os dialectos. O servizo de tradución Batua, por exemplo, está baseado na intelixencia artificial e as redes neuronais e é un proxecto desenvolvido polo centro tecnolóxico Vicomtech e promovido por Euskaltel, Mondragonlingua e EITB. Este servizo de tradución coñece o eúscaro batua, o francés, o castelán, o inglés e o biscaíño. Ademais, é capaz de facer traducións entre o eúscaro e todas esas linguas. “No caso dos dialectos vascos é moito máis difícil obter datos; se o eúscaro se custa no batua, pensa no biscaíño ou no labortano”, dixo Pérez. En canto aos dialectos, a falta de normas e as variantes existentes en cada zona dificultan o proceso: “O biscaíño non está unido, entón se alimentamos a máquina cos dialectos de Getxo, Gernika ou Ondarroa, é moi difícil crear un pratón”. A pesar das

dificultades, iso non quere dicir que en Euskal Herria non se xere contido de calidade. De feito, Cortés destacou que se coida "moito" o contido que se xera en eúscaro: “Cos datos que temos estamos a conseguir resultados moi ordenados”. Ademais, engadiu que a intelixencia artificial ha aberto outras portas ao eúscaro, xa que se atopaban "acoutadas" con sistemas antigos. Explica que cos primeiros sistemas non chegaban a crear e pór a disposición sistemas “verdadeiramente útiles”.

Trasladado á práctica explica os avances en tradución automática: “Antes non funcionaba ben, pero agora si”. En 2007 Elhuyar e a UPV crearon Matxin, o primeiro tradutor automático libre. O sistema desta época non estaba baseado na intelixencia artificial: “No caso do eúscaro, os resultados que daba non se achegaban aos que temos hoxe en día. Até 2016 non conseguimos un sistema de calidade para a tradución entre o eúscaro e o castelán”. Na actualidade, Elia é coñecida como o tradutor automático.

Pola contra, no caso doutros idiomas, por exemplo, para as traducións entre o castelán e o galego, na actualidade utilízanse sistemas antigos que aínda non se basean na intelixencia artificial: “Nas linguas máis próximas ou con similitudes obtíñanse moi bos resultados. No caso do eúscaro hai declinaciones, os verbos son diferentes e a orde das palabras é libre. Isto crea dificultades para crear regras de paso dun idioma a outro. Grazas á intelixencia artificial hoxe en día non hai case límites".

Itziar Cortes, Elhuyar: “Se utilizamos o tradutor automático para traducir ao euskera o que non está en eúscaro e non miramos si a tradución está ben, non favorecemos ao eúscaro”

Como a tecnoloxía é
capaz de facer cada vez máis cousas, Cortés cre que hai que ser “razoables”. Pola contra, en lugar de ser un instrumento para a difusión do eúscaro, di que pode ser contraproducente: “Se utilizamos o contido creado en eúscaro para traducilo, estamos a difundir o contido que dalgunha maneira creouse en eúscaro. Pero si utilizamos o tradutor automático para traducir ao euskera o que non está en eúscaro e non miramos si a tradución está ben, non favorecemos ao eúscaro”. Engadiu que isto fará que a medio prazo teñamos textos de “baixa calidade”: “Se utilizamos estes textos para adestrar sistemas de futuro, a calidade do eúscaro será baixa”. Ademais de

revisar o contido que se xera, que se pode facer para garantir a calidade? O Centro de Tecnoloxía Lingüística HiTZ adoptou varias vías para iso. En primeiro lugar, utilizáronse os contidos dos medios de comunicación vascos con licenza Creative Commons. Debido a que estes datos non son suficientes, tamén se recorreu aos grandes arquivos e filtrouse o seu contido a través dun filtro. “Conseguimos 4.000.000 de documentos, pero non é suficiente para crear unha ferramenta como ChatGPT; con todo, conseguimos bos resultados”.

Outro exemplo son as ferramentas Elia, Entzun e TTS que ten Elhuyar. O tres baséanse na intelixencia artificial. O tradutor neuronal Elia traduce en poucos segundos textos sinxelos e documentos con formato. A plataforma de expertos procesa arquivos de audio e vídeo previamente gravados e crea as súas transcricións e subtítulos. O neuronal TTS converte o texto en voz. As tecnoloxías de Elhuyar coñecen o eúscaro, o castelán, o francés, o inglés, o catalán e o galego. Isto significa que Elia, Entzun e TTS pódense utilizar neses seis idiomas. É a última novidade de Elhuyar: “Habemos visto que os clientes son multilingües e que queren utilizar a nosa tecnoloxía noutros idiomas diferentes ao eúscaro. Tendo o eúscaro como eixo principal, poden utilizar a única ferramenta en máis idiomas”.

Elhuyar zientzia.eus ten integrado na súa web ao tradutor neuronal. Nota: “Texto escrito en eúscaro e traducido automaticamente a través de Elia, sen supervisión posterior”. Neste exemplo o texto aparece en catanata.

Cortés cre que todas estas ferramentas poden axudar a “ampliar” o eúscaro: “Non temos que ter medo a crear en eúscaro. Se queremos chegar a máis xente, ademais dos tradutores profesionais, hoxe en día temos moitas ferramentas”. En Elhuyar, por exemplo, a maioría das veces crean cousas en eúscaro, pero traducen algunhas cousas fóra de Euskal Herria cun tradutor automático. Sempre avisando ao usuario e ofrecendo a posibilidade de acceder á versión orixinal.Por exemplo

, no portal zientzia.eus teñen un tradutor automático integrado. Isto significa que se unha persoa pon en Internet o sistema Como xurdiu ou solar? -Como xurdiu o sistema solar? en galego–, que se pode acceder ao portal zientzia.eus. Na páxina web ofrécese a posibilidade de ler noutro idioma e ver a versión orixinal. “Temos claro que o lector ten que saber que é un texto feito por un tradutor automático, e non por unha persoa”, dixo Cortés.

ARGIA participou recentemente no proxecto Itzulinguru e, do mesmo xeito que a web zientzia.eus, integrou ao tradutor automático no experimento proposto polo Cluster de Sociolingüística e o grupo de investigación Innoklab da UPV/EHU. Este proxecto contou coa participación de: Elhuyar, AEK, Orai, Centro de Intelixencia Artificial, Osakidetza, Departamento de Educación do Goberno Vasco e Hekimen.Aínda que usan o

tradutor automático, non deixan todo en mans das ferramentas. Os membros de Elhuyar repasan o contido para garantir a súa calidade. Ás veces son os investigadores e outras os tradutores profesionais: “Nós témolo claro: necesítanse tradutores profesionais porque co automático non conséguese o 100% da calidade. Ademais, non podes deixar a calquera que saiba si un texto é bo ou non, porque non todos temos os mesmos criterios”. Todos estes instrumentos e recursos que existen na

actualidade poden axudar á aprendizaxe de idiomas. Con todo, que ocorre si, en lugar de espertar as ganas de aprender, fan que non teñan ganas de aprender o idioma? Segundo Pérez, aínda que o desexo ou a necesidade de aprender unha lingua está ligado á necesidade de comunicar, non se limita a iso: “No que respecta ao eúscaro, non creo que ninguén aprenda a comunicarse por si só. É unha elección e hai moitas cousas máis cerca. Realmente, se queres aprender euskera, francés, árabe ou calquera idioma, este tipo de ferramentas facilitaranche o camiño, pero un tradutor non darache o pracer de ler en eúscaro directamente”.


Interésache pola canle: Adimen artifiziala
2024-11-08 | Leire Ibar
Máis da metade das empresas farmacéuticas utilizan intelixencia artificial
Desenvolver medicamentos "para acelerar, personalizar tratamentos e optimizar procesos internos. O 33% das empresas utiliza a intelixencia artificial na análise de enfermidades e o 29% no desenvolvemento e fabricación de medicamentos.

Tecnoloxía
Resposta do Creador AA

Hai moitos anos o Dr. Coñecín o abuse chatbot, e tamén me dei conta da velocidade coa que as persoas poden engancharse a estas máquinas. Sendo animais sociais, a relación é natural e necesaria, e como di o nome de 'relación', sempre leva unha resposta por parte do outro... [+]


2024-11-01 | Sustatu | Sustatu
Wikipedia Necesidade e proxecto de liberar a AA dun contido incorrecto (pero non de todo AA)
WikiProject inicia o proxecto AI Cleanup en Wikipedia: "A limpeza da Intelixencia Artificial", por dicilo dalgunha maneira. Os wikilaris voluntarios comezaron polo momento en inglés, francés e alemán nesta iniciativa creada para detectar e, en caso de erro, eliminar os... [+]

Tecnoloxía
Cacofonías

No último ano sucedeume ver a persoas relacionadas co ámbito non profesional en grupos dixitais que utilizaron a intelixencia artificial para dar argumentos aos demais. O compartido como propio. A propia, pero non a vinculada ao sentido da propiedade, senón a procesada desde... [+]


2024-10-29 | Leire Ibar
En dez anos a acumulación de lixo electrónico pódese multiplicar por mil
A intelixencia artificial pode xerar até cinco millóns de toneladas de residuos electrónicos en 2030, segundo un informe publicado pola revista Nature Computational Science. Os investigadores destacan a necesidade de implementar unha estratexia de economía circular.

2024-10-25 | Leire Ibar
Un profesor navarro acusa a 28 mulleres de gravar ás agachadas
A Policía Foral de Navarra abriu unha investigación para tratar de localizar a un profesor de Ensino Secundario. O imputado está acusado de gravar a mulleres ás agachadas nos aseos do instituto e nos vestiarios de varias tendas.

Eúscaro Adaptado 2024
Máis que tecnoloxía artificial, persoas e comunidades a primeira liña
A décimo terceira edición da xornada Euskarabildua, organizada pola empresa de comunicación Iametza en colaboración con ARGIA e Ametzagaina, terá como lema a tecnoloxía non artificial. Reivindicarán un uso "máis ético, máis sostible e máis viable" da tecnoloxía, así... [+]

2024-09-27 | Rober Gutiérrez
Intelixencia artificial: unha nova oportunidade para o eúscaro

A Intelixencia Artificial (IA) está a revolucionar non só noso día a día, senón tamén a forma de traballar nas empresas e de interactuar coas empresas a través de ferramentas de Intelixencia Artificial ou de desenvolvementos no uso da tecnoloxía lingüística. É de... [+]


Microsoft reactiva a central nuclear de Three Mile Island para alimentar a intelixencia artificial
En 1979 produciuse un accidente nuclear nunha das unidades da central nuclear de Three Mile Island, no estado estadounidense de Pensilvania. A outra, que se pechou en 2019, volverá funcionar para satisfacer as grandes necesidades enerxéticas da intelixencia artificial de... [+]

Tecnoloxía
Visión MundoAA

Os seres humanos nunca foron fáciles de pensar con tranquilidade durante longos períodos de tempo, vivimos coa responsabilidade de sacar adiante a nosa vida, tanto a nosa como a dos nosos descendentes. Nesta oportunidade que tivemos de vivir, queremos facer as cousas o mellor... [+]


O Goberno Vasco anuncia un proceso de debate sobre o uso do móbil nas aulas
A conselleira de Educación do Goberno Vasco ha animado aos docentes a utilizar a intelixencia artificial na escola para que non teñan medo á transformación dixital. Tamén anunciou un proceso de reflexión sobre o uso do móbil na aula: “Non existe evidencia clara sobre a... [+]

2024-08-01 | Sustatu
Que facer Elon Musken Grok para non alimentar a intelixencia artificial (opcional)
Un dos proxectos de Elon Musk é a intelixencia artificial, Grok, e para iso están a utilizar a actividade dos usuarios de X ou Twitter da propiedade de Musk para ampliar e adestrar o modelo lingüístico. De feito, o permiso para alimentar este sistema nas súas... [+]

2024-07-24 | Sustatu
Claude, outra intelixencia artificial que fala moi ben euskera
A empresa Anthropic lanzou o pasado mes de xuño a versión Claude 3.5 Sonnet da Intelixencia Artificial Claude (AA).E a novidade da semana pasada, a aplicación Android. Como xa estamos afeitos a estes imbentos AA, o eúscaro é moi ordenado. O experto vasco Beñat Erezuma... [+]

Tecnoloxía
Euskalgintza dixital crítica

O eúscaro é un porto para o coñecemento e as relacións no mar, que é un espazo dixital. Con intelixencia artificial, parece que desde este porto ofrécese a posibilidade de contactar en euskera con todo o mundo. A automatización do eúscaro é un gran apoio para os... [+]


2024-06-21 | Sustatu
Trampa nun concurso de imaxes AA con foto real
Nun concurso de fotografía baseado en Internet, en 1839 Cor Photography Awards, prodúcese unha trampa. Crearon unha categoría especial para a edición de 2024, na que presentaban imaxes de Intelixencia Artificial, e o gañador fixo unha trampa, un premio que gañou... [+]

Eguneraketa berriak daude