Traduït automàticament del basc, la traducció pot contenir errors. Més informació. Elhuyarren itzultzaile automatikoaren logoa

Latxa: Hitz crea el model lingüístic més gran i lliure en basc

  • Fa poc es va presentar el gran model de llengua catalana lliure anomenat Aina Flor, i en la notícia de la setmana passada dèiem que el director del Centre Basc Hitz, Eneko Agirre, va anunciar que en breu també venia en basc. I ahir mateix es va fer públic el Centre Hitz: Latxa. LLM és un gran model lingüístic, una superbase de dades en la qual es basen les iniciatives d'intel·ligència artificial. Els LLM són la base de les versions ChatGPT d'OpenAI, per exemple. Ara tenim un d'aquests, en basc (bo, un munt de models de veritat, format per 3 corpus).
Artikulu hau CC BY-SA 3.0 lizentziari esker ekarri dugu.

30 de gener de 2024 - 07:30

Segons Hitz Zentroa "és la família de models oberts" Latxa, que inclou el "major model lingüístic en basc". Està construïda sobre el model lingüístic Meta o Facebook Flama 2 i segueix la seva llicència. Flama 2 ja ha vist excel·lents resultats en basc, capaç de realitzar una correcta traducció automàtica oral en basca a través del producte Seamless M4T. El logo de Latxa és precisament el que uneix a Flama i a l'ovella basca, encara que també hi ha una connexió en nom (com ens ha semblat).

Latxa recull models d'entre 7 i 70 mil milions de paràmetres. Quant al conjunt de textos per a la construcció de models, els investigadors bascos han utilitzat EusCrawl, un conjunt de textos en basc de 1,72 milions de documents i 288 milions de paraules. EusCrawl es va extreure de 33 webs de contingut de qualitat, oferint major qualitat que altres tècniques de formació de corpus des d'Internet.

De fet, Latxa no s'ha fet per al públic general, això vindrà més endavant. Tanmateix, els tres models estan disponibles en la plataforma HuggingFace i podran ser utilitzats per l'enginyer expert consultant el “model card”, on es troben les instruccions per a la informació tècnica i la iniciació en l'ús dels models.

El desenvolupament de Latxa ha estat el resultat d'una iniciativa de recerca, innovació i desenvolupament, que forma part del projecte IKER-GAITIK, secundat pel Govern Basc, en col·laboració amb el programa europeu EuroHpc.

Els models lingüístics actuals tenen un rendiment sorprenent, com l'anglès ChatGPT o l'anglès Bard. No obstant això, en el cas de les llengües minoritàries i el basc no. Amb aquests models ha fet un pas en la sessió d'Hitz Zentroa per a donar la volta a la situació, i segons les seves dades, Latxa respon millor que altres sistemes a les formulacions en basca.

Més informació, aquí.

En Hugginface: Latxa.


T'interessa pel canal: Adimen artifiziala
2025-01-10 | Sustatu
Apple inventa extractes de notícies sense preocupar-se
Ampliació del magatzem de disbarats amb Intel·ligència Artificial. Les creades pels usuaris corrents poden ser en gran manera insensates, però les pròpies gegants d'Internet estan repetint aquestes situacions i això sembla més greu, ja que poden tenir un impacte global. Un... [+]

2024-11-08 | Leire Ibar
Més de la meitat de les empreses farmacèutiques utilitzen intel·ligència artificial
Desenvolupar medicaments "per a accelerar, personalitzar tractaments i optimitzar processos interns. El 33% de les empreses utilitza la intel·ligència artificial en l'anàlisi de malalties i el 29% en el desenvolupament i fabricació de medicaments.

Tecnologia
Resposta del Creador AA

Fa molts anys el Dr. Vaig conèixer l'abusi bot, i també em vaig adonar de la velocitat amb la qual les persones poden enganxar-se a aquestes màquines. Sent animals socials, la relació és natural i necessària, i com diu el nom de 'relació', sempre comporta una resposta per... [+]


2024-11-01 | Sustatu | Sustatu
Wikipedia Necessitat i projecte d'alliberar a AA d'un contingut incorrecte (però no de tot AA)
WikiProject inicia el projecte AI Cleanup en Wikipedia: "La neteja de la Intel·ligència Artificial", per dir-ho d'alguna manera. Els wikilaris voluntaris han començat de moment en anglès, francès i alemany en aquesta iniciativa creada per a detectar i, en cas d'error, eliminar... [+]

Tecnologia
Cacofonies

En l'últim any m'ha succeït veure a persones relacionades amb l'àmbit no professional en grups digitals que han utilitzat la intel·ligència artificial per a donar arguments als altres. El compartit com a propi. La pròpia, però no la vinculada al sentit de la propietat, sinó... [+]


2024-10-29 | Leire Ibar
En deu anys l'acumulació d'escombraries electròniques es pot multiplicar per mil
La intel·ligència artificial pot generar fins a cinc milions de tones de residus electrònics en 2030, segons un informe publicat per la revista Nature Computational Science. Els investigadors destaquen la necessitat d'implementar una estratègia d'economia circular.

2024-10-25 | Leire Ibar
Un professor navarrès acusa 28 dones de gravar d'amagat
La Policia Foral de Navarra ha obert una recerca per a tractar de localitzar a un professor d'Ensenyament Secundari. L'imputat està acusat de gravar a dones d'amagat en els lavabos de l'institut i en els vestuaris de diverses botigues.

Basc Adaptat 2024
Més que tecnologia artificial, persones i comunitats a primera línia
La tretzena edició de la jornada Euskarabildua, organitzada per l'empresa de comunicació Iametza en col·laboració amb ARGIA i Ametzagaina, tindrà com a lema la tecnologia no artificial. Reivindicaran un ús "més ètic, més sostenible i més viable" de la tecnologia, així... [+]

2024-09-27 | Rober Gutiérrez
Intel·ligència artificial: una nova oportunitat per al basc

La Intel·ligència Artificial (IA) està revolucionant no sols el nostre dia a dia, sinó també la manera de treballar en les empreses i d'interactuar amb les empreses a través d'eines d'Intel·ligència Artificial o de desenvolupaments en l'ús de la tecnologia lingüística... [+]


Microsoft reactiva la central nuclear de Three Mile Island per a alimentar la intel·ligència artificial
En 1979 es va produir un accident nuclear en una de les unitats de la central nuclear de Three Mile Island, en l'estat estatunidenc de Pennsilvània. L'altra, que es va tancar en 2019, tornarà a funcionar per a satisfer les grans necessitats energètiques de la intel·ligència... [+]

Tecnologia
Visió MundoAA

Els éssers humans mai han estat fàcils de pensar amb tranquil·litat durant llargs períodes de temps, vivim amb la responsabilitat de tirar endavant la nostra vida, tant la nostra com la dels nostres descendents. En aquesta oportunitat que hem tingut de viure, volem fer les... [+]


El Govern Basc anuncia un procés de debat sobre l'ús del mòbil a les aules
La consellera d'Educació del Govern Basc ha animat als docents a utilitzar la intel·ligència artificial a l'escola perquè no tinguin por a la transformació digital. També ha anunciat un procés de reflexió sobre l'ús del mòbil a l'aula: “No existeix evidència clara sobre... [+]

2024-08-01 | Sustatu
Què fer Elon Musken Grok per a no alimentar la intel·ligència artificial (opcional)
Un dels projectes d'Elon Musk és la intel·ligència artificial, Grok, i per a això estan utilitzant l'activitat dels usuaris de X o Twitter de la propietat de Musk per a ampliar i entrenar el model lingüístic. De fet, el permís per a alimentar aquest sistema en les seves... [+]

2024-07-24 | Sustatu
Claude, una altra intel·ligència artificial que parla molt ben basca
L'empresa Anthropic va llançar el mes de juny passat la versió Claude 3.5 Sonnet de la Intel·ligència Artificial Claude (AA).I la novetat de la setmana passada, l'aplicació Android. Com ja estem acostumats a aquests imbentos AA, el basc és molt ordenat. L'expert basc... [+]

Tecnologia
Euskalgintza digital crítica

El basc és un port per al coneixement i les relacions en la mar, que és un espai digital. Amb intel·ligència artificial, sembla que des d'aquest port s'ofereix la possibilitat de contactar en basca amb tothom. L'automatització del basc és un gran suport per als educadors que... [+]


Eguneraketa berriak daude