Está na fala da xente e no día a día utilízase máis a intelixencia artificial do que se cree. Pero que é? “Para dar unha definición simple diría que é un campo entre a matemática e a informática, no que aos computadores dánselles as competencias humanas, como a capacidade lingüística, a vista, o movemento…”, explica Naiara Pérez. A mente pode ser exacta ou xeral. É dicir, o específico serve para algunhas accións, como, por exemplo, acceder a un túnel e acender automaticamente as luces do coche ou preguntar cousas aos auxiliares de voz. Pola contra, o xenérico é algo similar ao ser humano e é capaz de realizar máis dunha acción, como é o caso do interlocutor artificial ChatGPT de Open Ao.
A intelixencia artificial funciona mediante redes neuronais. As redes neuronais tratan de imitar cos instrumentos de computación o sistema nervioso humano e a forma de aprender. Para iso, é necesario informar e deseñar algoritmos de aprendizaxe que capaciten as ferramentas para aprender patróns. “Aínda non chegamos, pero empezamos a expornos realmente si nos próximos anos a intelixencia artificial pode representar á mente dun ser humano”, dixo Pérez.
No entanto, Pombo fixo un comunicado no que lembra que a intelixencia artificial é unha ferramenta: “Non deixaría que nos sedujamos. Debemos utilizar a tecnoloxía de forma racional, para usos realmente útiles e de forma ética”.
Eli Pombo, Iametza: “Sinto que estamos a tentar perder o tren e facer sitio, pero non son pesimista. Á parte das dificultades, creo que tamén temos vento favorable”
A intelixencia artificial pódese aplicar en moitos sectores, entre eles o procesamiento da linguaxe. Neste ámbito inclúense, entre outros, os sistemas de recoñecemento e tradución simultánea da lingua escrita, os sistemas de recepción e escritura da lingua oral e os sistemas de conversión de textos en voz. Segundo Pérez, nos últimos anos no País Vasco hai “moitos” investigadores en tecnoloxía lingüística e desenvolvemento, e hai un sector “forte”: “Estamos a xurdir de nós”. Por tanto, hai un sector que investiga en eúscaro, pero en todo este bulebule da tecnoloxía, cal é o lugar que ten o eúscaro? Que beneficios e inconvenientes ten? Que dificultades e posibilidades ten o eúscaro?
“A intelixencia artificial é a realidade que nos rodea e o eúscaro ten que estar aí. Se non, perde oportunidades na presenza dixital”, subliñou Pombo. Ademais, engadiu que se trata dunha oportunidade para que o eúscaro se estenda a outros lugares. Pérez sumouse a iso e lembrou que as ferramentas de gran proxección, como ChatGPT, adoitan estar en mans de grandes empresas: “Non podemos quedarnos á espera do que vaian facer as grandes empresas. A prioridade de empresas como Google e Microsoft non é ter en conta todos os idiomas do mundo. Este tipo de empresas céntranse nos idiomas con maior número de clientes, é dicir, nas linguas hexemónicas”. Con todo, engadiu que neste tipo de empresas tamén se comezou a integrar o eúscaro.
Pombo sente que os investigadores que traballan en eúscaro neste sentido están “a loitar”: “Sinto que estamos a tentar perder o tren e facer sitio, pero non son pesimista. Á parte das dificultades, creo que tamén temos vento favorable”. Tamén di que hai "moita vontade" de facer as cousas por parte das institucións públicas e da cidadanía. Ademais, segundo Pombo, é “imposible” competir contra os avances que fan as grandes empresas: “Temos que seguir facendo as cousas con sentido común e sen frustrar”.
Soberanía tecnolóxica Dado que a
tecnoloxía se basea en datos en xeral, Pombo considera que para non pór a información a disposición das grandes empresas é necesario xestionala “de forma soberana”: “O software libre permíteche mellorar o que fixeches por ti e fortalece a economía local”. Neste sentido, Cortés advertiu de que o uso destes datos por parte dos usuarios foi "racional". Por iso, en Elhuyar non se utilizan os datos dos clientes para adestrar as ferramentas: “Temos que estar atentos, non lemos a letra pequena ou non nos avisan e sen querer estamos a alimentar estes sistemas”. Pérez tamén fixo fincapé na orixe dos datos e afirmou que nos modelos libres o aspecto ético é "máis limpo".Tamén subliñaron
o impacto que ten traballar desde as necesidades e aspiracións locais. “Se o facemos nós, crearemos o contido que teñen os temas que nos interesan”, dixo Pérez. Engadiu que a creación de “tecnoloxía punteira” contribúe a “alimentar” ao sector tecnolóxico e ao sector da investigación no País Vasco: “Se traballamos de forma aberta podemos promover a colaboración entre os centros de investigación de aquí”.
Naiara Perez, Centro I.T.: “Non podemos quedarnos á espera do que fagan as grandes empresas. A prioridade de empresas como Google e Microsoft non é ter en conta todos os idiomas do mundo”
Son moitos os que pon a disposición dos demais ferramentas para desenvolver a tecnoloxía. Exemplo diso é o Latxa creado polo Centro de Tecnoloxía Lingüística HiTZ da UPV/EHU. A linguaxe é un gran modelo, e cando se dá unha sucesión de textos a este tipo de modelos, dan a palabra máis probable. “Latxa non fai nada en por si, é un motor que xera outras aplicacións”, explica Pérez. Por exemplo, o corrector ortográfico serve para crear aplicacións de resposta a preguntas e exercicios automáticos no ensino: “Nós, por exemplo, incluímos a Latxa como usuario no xogo Unha vez ao día para dar respostas”. Está dispoñible na rede e pode descargala calquera persoa.
Falta de información, dificultade
Os datos son o tesouro da intelixencia artificial. De feito, para adestrar as ferramentas necesítanse o maior número de datos de calidade posible. Por exemplo, para crear un sistema que escoite a voz e transcríbea directamente necesítanse moitas gravacións e transcricións. Os investigadores entrevistados han subliñado que unha das grandes dificultades que ten o eúscaro é a obtención de grandes cantidades de datos. “En comparación coas linguas hexemónicas, o eúscaro non ten tanto contido, e entón é máis difícil obter resultados”, dixo Pérez. Iso si, Cortés sumouse a iso, aínda que cre que, en comparación con outras linguas minoritarias, hai "máis" contido en eúscaro.A maioría das
ferramentas actuais están formadas en eúscaro unificado, aínda que tamén existen ferramentas que traballan os dialectos. O servizo de tradución Batua, por exemplo, está baseado na intelixencia artificial e as redes neuronais e é un proxecto desenvolvido polo centro tecnolóxico Vicomtech e promovido por Euskaltel, Mondragonlingua e EITB. Este servizo de tradución coñece o eúscaro batua, o francés, o castelán, o inglés e o biscaíño. Ademais, é capaz de facer traducións entre o eúscaro e todas esas linguas. “No caso dos dialectos vascos é moito máis difícil obter datos; se o eúscaro se custa no batua, pensa no biscaíño ou no labortano”, dixo Pérez. En canto aos dialectos, a falta de normas e as variantes existentes en cada zona dificultan o proceso: “O biscaíño non está unido, entón se alimentamos a máquina cos dialectos de Getxo, Gernika ou Ondarroa, é moi difícil crear un pratón”. A pesar das
dificultades, iso non quere dicir que en Euskal Herria non se xere contido de calidade. De feito, Cortés destacou que se coida "moito" o contido que se xera en eúscaro: “Cos datos que temos estamos a conseguir resultados moi ordenados”. Ademais, engadiu que a intelixencia artificial ha aberto outras portas ao eúscaro, xa que se atopaban "acoutadas" con sistemas antigos. Explica que cos primeiros sistemas non chegaban a crear e pór a disposición sistemas “verdadeiramente útiles”.
Trasladado á práctica explica os avances en tradución automática: “Antes non funcionaba ben, pero agora si”. En 2007 Elhuyar e a UPV crearon Matxin, o primeiro tradutor automático libre. O sistema desta época non estaba baseado na intelixencia artificial: “No caso do eúscaro, os resultados que daba non se achegaban aos que temos hoxe en día. Até 2016 non conseguimos un sistema de calidade para a tradución entre o eúscaro e o castelán”. Na actualidade, Elia é coñecida como o tradutor automático.
Pola contra, no caso doutros idiomas, por exemplo, para as traducións entre o castelán e o galego, na actualidade utilízanse sistemas antigos que aínda non se basean na intelixencia artificial: “Nas linguas máis próximas ou con similitudes obtíñanse moi bos resultados. No caso do eúscaro hai declinaciones, os verbos son diferentes e a orde das palabras é libre. Isto crea dificultades para crear regras de paso dun idioma a outro. Grazas á intelixencia artificial hoxe en día non hai case límites".
Itziar Cortes, Elhuyar: “Se utilizamos o tradutor automático para traducir ao euskera o que non está en eúscaro e non miramos si a tradución está ben, non favorecemos ao eúscaro”
Como a tecnoloxía é
capaz de facer cada vez máis cousas, Cortés cre que hai que ser “razoables”. Pola contra, en lugar de ser un instrumento para a difusión do eúscaro, di que pode ser contraproducente: “Se utilizamos o contido creado en eúscaro para traducilo, estamos a difundir o contido que dalgunha maneira creouse en eúscaro. Pero si utilizamos o tradutor automático para traducir ao euskera o que non está en eúscaro e non miramos si a tradución está ben, non favorecemos ao eúscaro”. Engadiu que isto fará que a medio prazo teñamos textos de “baixa calidade”: “Se utilizamos estes textos para adestrar sistemas de futuro, a calidade do eúscaro será baixa”. Ademais de
revisar o contido que se xera, que se pode facer para garantir a calidade? O Centro de Tecnoloxía Lingüística HiTZ adoptou varias vías para iso. En primeiro lugar, utilizáronse os contidos dos medios de comunicación vascos con licenza Creative Commons. Debido a que estes datos non son suficientes, tamén se recorreu aos grandes arquivos e filtrouse o seu contido a través dun filtro. “Conseguimos 4.000.000 de documentos, pero non é suficiente para crear unha ferramenta como ChatGPT; con todo, conseguimos bos resultados”.
Outro exemplo son as ferramentas Elia, Entzun e TTS que ten Elhuyar. O tres baséanse na intelixencia artificial. O tradutor neuronal Elia traduce en poucos segundos textos sinxelos e documentos con formato. A plataforma de expertos procesa arquivos de audio e vídeo previamente gravados e crea as súas transcricións e subtítulos. O neuronal TTS converte o texto en voz. As tecnoloxías de Elhuyar coñecen o eúscaro, o castelán, o francés, o inglés, o catalán e o galego. Isto significa que Elia, Entzun e TTS pódense utilizar neses seis idiomas. É a última novidade de Elhuyar: “Habemos visto que os clientes son multilingües e que queren utilizar a nosa tecnoloxía noutros idiomas diferentes ao eúscaro. Tendo o eúscaro como eixo principal, poden utilizar a única ferramenta en máis idiomas”.
Cortés cre que todas estas ferramentas poden axudar a “ampliar” o eúscaro: “Non temos que ter medo a crear en eúscaro. Se queremos chegar a máis xente, ademais dos tradutores profesionais, hoxe en día temos moitas ferramentas”. En Elhuyar, por exemplo, a maioría das veces crean cousas en eúscaro, pero traducen algunhas cousas fóra de Euskal Herria cun tradutor automático. Sempre avisando ao usuario e ofrecendo a posibilidade de acceder á versión orixinal.Por exemplo
, no portal zientzia.eus teñen un tradutor automático integrado. Isto significa que se unha persoa pon en Internet o sistema Como xurdiu ou solar? -Como xurdiu o sistema solar? en galego–, que se pode acceder ao portal zientzia.eus. Na páxina web ofrécese a posibilidade de ler noutro idioma e ver a versión orixinal. “Temos claro que o lector ten que saber que é un texto feito por un tradutor automático, e non por unha persoa”, dixo Cortés.
ARGIA participou recentemente no proxecto Itzulinguru e, do mesmo xeito que a web zientzia.eus, integrou ao tradutor automático no experimento proposto polo Cluster de Sociolingüística e o grupo de investigación Innoklab da UPV/EHU. Este proxecto contou coa participación de: Elhuyar, AEK, Orai, Centro de Intelixencia Artificial, Osakidetza, Departamento de Educación do Goberno Vasco e Hekimen.Aínda que usan o
tradutor automático, non deixan todo en mans das ferramentas. Os membros de Elhuyar repasan o contido para garantir a súa calidade. Ás veces son os investigadores e outras os tradutores profesionais: “Nós témolo claro: necesítanse tradutores profesionais porque co automático non conséguese o 100% da calidade. Ademais, non podes deixar a calquera que saiba si un texto é bo ou non, porque non todos temos os mesmos criterios”. Todos estes instrumentos e recursos que existen na
actualidade poden axudar á aprendizaxe de idiomas. Con todo, que ocorre si, en lugar de espertar as ganas de aprender, fan que non teñan ganas de aprender o idioma? Segundo Pérez, aínda que o desexo ou a necesidade de aprender unha lingua está ligado á necesidade de comunicar, non se limita a iso: “No que respecta ao eúscaro, non creo que ninguén aprenda a comunicarse por si só. É unha elección e hai moitas cousas máis cerca. Realmente, se queres aprender euskera, francés, árabe ou calquera idioma, este tipo de ferramentas facilitaranche o camiño, pero un tradutor non darache o pracer de ler en eúscaro directamente”.
Hai moitos anos o Dr. Coñecín o abuse chatbot, e tamén me dei conta da velocidade coa que as persoas poden engancharse a estas máquinas. Sendo animais sociais, a relación é natural e necesaria, e como di o nome de 'relación', sempre leva unha resposta por parte do outro... [+]
No último ano sucedeume ver a persoas relacionadas co ámbito non profesional en grupos dixitais que utilizaron a intelixencia artificial para dar argumentos aos demais. O compartido como propio. A propia, pero non a vinculada ao sentido da propiedade, senón a procesada desde... [+]
A Intelixencia Artificial (IA) está a revolucionar non só noso día a día, senón tamén a forma de traballar nas empresas e de interactuar coas empresas a través de ferramentas de Intelixencia Artificial ou de desenvolvementos no uso da tecnoloxía lingüística. É de... [+]
Os seres humanos nunca foron fáciles de pensar con tranquilidade durante longos períodos de tempo, vivimos coa responsabilidade de sacar adiante a nosa vida, tanto a nosa como a dos nosos descendentes. Nesta oportunidade que tivemos de vivir, queremos facer as cousas o mellor... [+]
O eúscaro é un porto para o coñecemento e as relacións no mar, que é un espazo dixital. Con intelixencia artificial, parece que desde este porto ofrécese a posibilidade de contactar en euskera con todo o mundo. A automatización do eúscaro é un gran apoio para os... [+]