Traducido automaticamente do vasco, a tradución pode conter erros. Máis información aquí. Elhuyarren itzultzaile automatikoaren logoa

Latxa: Hitz crea o modelo lingüístico máis grande e libre en eúscaro

  • Hai pouco presentouse o gran modelo de lingua catalá libre chamado Aina Flor, e na noticia da semana pasada diciamos que o director do Centro Vasco Hitz, Eneko Agirre, anunciou que en breve tamén viña en eúscaro. E onte mesmo fíxose público o Centro Hitz: Latxa. LLM é un gran modelo lingüístico, unha superbase de datos na que se basean as iniciativas de intelixencia artificial. Os LLM son a base das versións ChatGPT de OpenAI, por exemplo. Agora temos un destes, en eúscaro (bo, unha chea de modelos de verdade, formado por 3 corpus).
Artikulu hau CC BY-SA 3.0 lizentziari esker ekarri dugu.

30 de xaneiro de 2024 - 07:30

Segundo Hitz Zentroa "é a familia de modelos abertos" Latxa, que inclúe o "maior modelo lingüístico en eúscaro". Está construída sobre o modelo lingüístico Meta ou Facebook Chama 2 e segue a súa licenza. Chama 2 xa viu excelentes resultados en eúscaro, capaz de realizar unha correcta tradución automática oral en eúscaro a través do produto Seamless M4T. O logo de Latxa é precisamente o que une a Chama e á ovella vasca, aínda que tamén hai unha conexión en nome (como nos pareceu).

Latxa recolle modelos de entre 7 e 70 mil millóns de parámetros. En canto ao conxunto de textos para a construción de modelos, os investigadores vascos han utilizado EusCrawl, un conxunto de textos en eúscaro de 1,72 millóns de documentos e 288 millóns de palabras. EusCrawl extraeuse de 33 webs de contido de calidade, ofrecendo maior calidade que outras técnicas de formación de corpus desde Internet.

De feito, Latxa non se fixo para o público xeral, iso virá máis adiante. Con todo, o tres modelos están dispoñibles na plataforma HuggingFace e poderán ser utilizados polo enxeñeiro experto consultando o “model card”, onde se atopan as instrucións para a información técnica e a iniciación no uso dos modelos.

O desenvolvemento de Latxa foi o resultado dunha iniciativa de investigación, innovación e desenvolvemento, que forma parte do proxecto IKER-GAITIK, apoiado polo Goberno Vasco, en colaboración co programa europeo EuroHpc.

Os modelos lingüísticos actuais teñen un rendemento sorprendente, como o inglés ChatGPT ou o inglés Bard. Con todo, no caso das linguas minoritarias e o eúscaro non. Con estes modelos deu un paso na sesión de Hitz Zentroa para dar a volta á situación, e segundo os seus datos, Latxa responde mellor que outros sistemas ás formulacións en eúscaro.

Máis información, aquí.

En Hugginface: Latxa.


Interésache pola canle: Adimen artifiziala
2025-01-10 | Sustatu
Apple inventa extractos de noticias sen preocuparse
Ampliación do almacén de disparates con Intelixencia Artificial. As creadas polos usuarios correntes poden ser en gran medida insensatas, pero os propias xigantes de Internet están a repetir estas situacións e iso parece máis grave, xa que poden ter un impacto global. Un... [+]

2024-11-08 | Leire Ibar
Máis da metade das empresas farmacéuticas utilizan intelixencia artificial
Desenvolver medicamentos "para acelerar, personalizar tratamentos e optimizar procesos internos. O 33% das empresas utiliza a intelixencia artificial na análise de enfermidades e o 29% no desenvolvemento e fabricación de medicamentos.

Tecnoloxía
Resposta do Creador AA

Hai moitos anos o Dr. Coñecín o abuse chatbot, e tamén me dei conta da velocidade coa que as persoas poden engancharse a estas máquinas. Sendo animais sociais, a relación é natural e necesaria, e como di o nome de 'relación', sempre leva unha resposta por parte do outro... [+]


2024-11-01 | Sustatu | Sustatu
Wikipedia Necesidade e proxecto de liberar a AA dun contido incorrecto (pero non de todo AA)
WikiProject inicia o proxecto AI Cleanup en Wikipedia: "A limpeza da Intelixencia Artificial", por dicilo dalgunha maneira. Os wikilaris voluntarios comezaron polo momento en inglés, francés e alemán nesta iniciativa creada para detectar e, en caso de erro, eliminar os... [+]

Tecnoloxía
Cacofonías

No último ano sucedeume ver a persoas relacionadas co ámbito non profesional en grupos dixitais que utilizaron a intelixencia artificial para dar argumentos aos demais. O compartido como propio. A propia, pero non a vinculada ao sentido da propiedade, senón a procesada desde... [+]


2024-10-29 | Leire Ibar
En dez anos a acumulación de lixo electrónico pódese multiplicar por mil
A intelixencia artificial pode xerar até cinco millóns de toneladas de residuos electrónicos en 2030, segundo un informe publicado pola revista Nature Computational Science. Os investigadores destacan a necesidade de implementar unha estratexia de economía circular.

2024-10-25 | Leire Ibar
Un profesor navarro acusa a 28 mulleres de gravar ás agachadas
A Policía Foral de Navarra abriu unha investigación para tratar de localizar a un profesor de Ensino Secundario. O imputado está acusado de gravar a mulleres ás agachadas nos aseos do instituto e nos vestiarios de varias tendas.

Eúscaro Adaptado 2024
Máis que tecnoloxía artificial, persoas e comunidades a primeira liña
A décimo terceira edición da xornada Euskarabildua, organizada pola empresa de comunicación Iametza en colaboración con ARGIA e Ametzagaina, terá como lema a tecnoloxía non artificial. Reivindicarán un uso "máis ético, máis sostible e máis viable" da tecnoloxía, así... [+]

2024-09-27 | Rober Gutiérrez
Intelixencia artificial: unha nova oportunidade para o eúscaro

A Intelixencia Artificial (IA) está a revolucionar non só noso día a día, senón tamén a forma de traballar nas empresas e de interactuar coas empresas a través de ferramentas de Intelixencia Artificial ou de desenvolvementos no uso da tecnoloxía lingüística. É de... [+]


Microsoft reactiva a central nuclear de Three Mile Island para alimentar a intelixencia artificial
En 1979 produciuse un accidente nuclear nunha das unidades da central nuclear de Three Mile Island, no estado estadounidense de Pensilvania. A outra, que se pechou en 2019, volverá funcionar para satisfacer as grandes necesidades enerxéticas da intelixencia artificial de... [+]

Tecnoloxía
Visión MundoAA

Os seres humanos nunca foron fáciles de pensar con tranquilidade durante longos períodos de tempo, vivimos coa responsabilidade de sacar adiante a nosa vida, tanto a nosa como a dos nosos descendentes. Nesta oportunidade que tivemos de vivir, queremos facer as cousas o mellor... [+]


O Goberno Vasco anuncia un proceso de debate sobre o uso do móbil nas aulas
A conselleira de Educación do Goberno Vasco ha animado aos docentes a utilizar a intelixencia artificial na escola para que non teñan medo á transformación dixital. Tamén anunciou un proceso de reflexión sobre o uso do móbil na aula: “Non existe evidencia clara sobre a... [+]

2024-08-01 | Sustatu
Que facer Elon Musken Grok para non alimentar a intelixencia artificial (opcional)
Un dos proxectos de Elon Musk é a intelixencia artificial, Grok, e para iso están a utilizar a actividade dos usuarios de X ou Twitter da propiedade de Musk para ampliar e adestrar o modelo lingüístico. De feito, o permiso para alimentar este sistema nas súas... [+]

2024-07-24 | Sustatu
Claude, outra intelixencia artificial que fala moi ben euskera
A empresa Anthropic lanzou o pasado mes de xuño a versión Claude 3.5 Sonnet da Intelixencia Artificial Claude (AA).E a novidade da semana pasada, a aplicación Android. Como xa estamos afeitos a estes imbentos AA, o eúscaro é moi ordenado. O experto vasco Beñat Erezuma... [+]

Tecnoloxía
Euskalgintza dixital crítica

O eúscaro é un porto para o coñecemento e as relacións no mar, que é un espazo dixital. Con intelixencia artificial, parece que desde este porto ofrécese a posibilidade de contactar en euskera con todo o mundo. A automatización do eúscaro é un gran apoio para os... [+]


Eguneraketa berriak daude