Segundo Hitz Zentroa "é a familia de modelos abertos" Latxa, que inclúe o "maior modelo lingüístico en eúscaro". Está construída sobre o modelo lingüístico Meta ou Facebook Chama 2 e segue a súa licenza. Chama 2 xa viu excelentes resultados en eúscaro, capaz de realizar unha correcta tradución automática oral en eúscaro a través do produto Seamless M4T. O logo de Latxa é precisamente o que une a Chama e á ovella vasca, aínda que tamén hai unha conexión en nome (como nos pareceu).
Latxa recolle modelos de entre 7 e 70 mil millóns de parámetros. En canto ao conxunto de textos para a construción de modelos, os investigadores vascos han utilizado EusCrawl, un conxunto de textos en eúscaro de 1,72 millóns de documentos e 288 millóns de palabras. EusCrawl extraeuse de 33 webs de contido de calidade, ofrecendo maior calidade que outras técnicas de formación de corpus desde Internet.
De feito, Latxa non se fixo para o público xeral, iso virá máis adiante. Con todo, o tres modelos están dispoñibles na plataforma HuggingFace e poderán ser utilizados polo enxeñeiro experto consultando o “model card”, onde se atopan as instrucións para a información técnica e a iniciación no uso dos modelos.
O desenvolvemento de Latxa foi o resultado dunha iniciativa de investigación, innovación e desenvolvemento, que forma parte do proxecto IKER-GAITIK, apoiado polo Goberno Vasco, en colaboración co programa europeo EuroHpc.
Os modelos lingüísticos actuais teñen un rendemento sorprendente, como o inglés ChatGPT ou o inglés Bard. Con todo, no caso das linguas minoritarias e o eúscaro non. Con estes modelos deu un paso na sesión de Hitz Zentroa para dar a volta á situación, e segundo os seus datos, Latxa responde mellor que outros sistemas ás formulacións en eúscaro.
Máis información, aquí.
En Hugginface: Latxa.
Hai moitos anos o Dr. Coñecín o abuse chatbot, e tamén me dei conta da velocidade coa que as persoas poden engancharse a estas máquinas. Sendo animais sociais, a relación é natural e necesaria, e como di o nome de 'relación', sempre leva unha resposta por parte do outro... [+]
No último ano sucedeume ver a persoas relacionadas co ámbito non profesional en grupos dixitais que utilizaron a intelixencia artificial para dar argumentos aos demais. O compartido como propio. A propia, pero non a vinculada ao sentido da propiedade, senón a procesada desde... [+]
A Intelixencia Artificial (IA) está a revolucionar non só noso día a día, senón tamén a forma de traballar nas empresas e de interactuar coas empresas a través de ferramentas de Intelixencia Artificial ou de desenvolvementos no uso da tecnoloxía lingüística. É de... [+]
Os seres humanos nunca foron fáciles de pensar con tranquilidade durante longos períodos de tempo, vivimos coa responsabilidade de sacar adiante a nosa vida, tanto a nosa como a dos nosos descendentes. Nesta oportunidade que tivemos de vivir, queremos facer as cousas o mellor... [+]
O eúscaro é un porto para o coñecemento e as relacións no mar, que é un espazo dixital. Con intelixencia artificial, parece que desde este porto ofrécese a posibilidade de contactar en euskera con todo o mundo. A automatización do eúscaro é un gran apoio para os... [+]