Segons Hitz Zentroa "és la família de models oberts" Latxa, que inclou el "major model lingüístic en basc". Està construïda sobre el model lingüístic Meta o Facebook Flama 2 i segueix la seva llicència. Flama 2 ja ha vist excel·lents resultats en basc, capaç de realitzar una correcta traducció automàtica oral en basca a través del producte Seamless M4T. El logo de Latxa és precisament el que uneix a Flama i a l'ovella basca, encara que també hi ha una connexió en nom (com ens ha semblat).
Latxa recull models d'entre 7 i 70 mil milions de paràmetres. Quant al conjunt de textos per a la construcció de models, els investigadors bascos han utilitzat EusCrawl, un conjunt de textos en basc de 1,72 milions de documents i 288 milions de paraules. EusCrawl es va extreure de 33 webs de contingut de qualitat, oferint major qualitat que altres tècniques de formació de corpus des d'Internet.
De fet, Latxa no s'ha fet per al públic general, això vindrà més endavant. Tanmateix, els tres models estan disponibles en la plataforma HuggingFace i podran ser utilitzats per l'enginyer expert consultant el “model card”, on es troben les instruccions per a la informació tècnica i la iniciació en l'ús dels models.
El desenvolupament de Latxa ha estat el resultat d'una iniciativa de recerca, innovació i desenvolupament, que forma part del projecte IKER-GAITIK, secundat pel Govern Basc, en col·laboració amb el programa europeu EuroHpc.
Els models lingüístics actuals tenen un rendiment sorprenent, com l'anglès ChatGPT o l'anglès Bard. No obstant això, en el cas de les llengües minoritàries i el basc no. Amb aquests models ha fet un pas en la sessió d'Hitz Zentroa per a donar la volta a la situació, i segons les seves dades, Latxa respon millor que altres sistemes a les formulacions en basca.
Més informació, aquí.
En Hugginface: Latxa.
Silicon Valley-ko oligarkia AEBetako gobernura iritsi berritan lehertu da adimen artifizialaren (AA) burbuila. Txip aurreratuen erraldoia den Nvidia-k urtarrilaren amaieran izandako %16,8ko balio galera, egun bakar batean inoiz izan den burtsa balio galerarik handiena da... [+]
Geroz eta ekoizpen gehiagok baliatzen dituzte teknologia berriak, izan plano orokor eta jendetsuak figurante bidez egitea aurrezteko, izan efektu bereziak are azkarrago egiteko. Azken urtean, dena den, Euskal Herriko zine-aretoak gehien bete dituztenetako bi pelikulek adimen... [+]
Diario de Noticias de Álava (DNA) egunkariko langileak sinadura greban daude, eta aspaldi ari dira beren lan baldintza “miserableak” eta horiek kazetaritzaren kalitatean duen eragina salatzen. 2013tik soldatak izoztuta dituzte, eta ordutik erosahalmenaren %30... [+]
«I will overturn, overturn, overturn, it[…]»
Ezequiel 21.27 – King James Version
«Per sobre de tots els algorismes, per sota de tots els
algorismes» Xabier Landabidea
Em sento incòmode, incòmode amb l'actitud gairebé religiosa de la nostra societat cap a la... [+]
Silicon Valleyko enpresa teknologiko handienei zaplazteko ederra eman die DeepSeek-ek. Adimen Artifizialeko chatbot txinatar merke eta berriak zalantzan jarri du AEBen nagusitasuna arlo horretan, eta erakutsi du ez dela milaka milioi diru behar modelo aurreratu eta efizienteak... [+]
Què haig de saber? Amb qui haig de relacionar-me? On haig de viure? Amb aquestes responsabilitats, els éssers humans estem en el camí de viure la idea d'una bona vida en el si de les nostres societats. Si no sabem respondre correctament, per por de quedar-nos en els... [+]
Fa molts anys el Dr. Vaig conèixer l'abusi bot, i també em vaig adonar de la velocitat amb la qual les persones poden enganxar-se a aquestes màquines. Sent animals socials, la relació és natural i necessària, i com diu el nom de 'relació', sempre comporta una resposta per... [+]