Traduït automàticament del basc, la traducció pot contenir errors. Més informació. Elhuyarren itzultzaile automatikoaren logoa

Google Translate: 24 idiomes més amb un nou model

  • Google Translate incorpora 24 idiomes al seu sistema automàtic de traducció. Hi ha llengües com el guaraní, l'aimara, el bambara o l'ewe de Ghana que el colonialisme va aixafar però no va matar.
Artikulu hau CC BY-SA 3.0 lizentziari esker ekarri dugu.

16 de maig de 2022 - 09:06

Tècnicament ha marcat una nova fita amb aquest increment de Google, tal com s'ha explicat en aquesta nota. La capacitat de traducció d'aquestes llengües s'ha aconseguit a través de l'ús de Zero-Shot Machine Translation, basat en la intel·ligència artificial, i es caracteritza pel funcionament d'aquest sistema sense l'ús de corpus bilingües. És a dir, Google (diuen) ha aconseguit construir el model d'aquest idioma usant només textos aymara i habilitar-lo per a traduccions.

Ens ha semblat que aquest model té relació amb el treball i la tesi de l'informàtic basc Mikel Artetxe (Traducció automàtica no supervisada), on va desenvolupar un procediment de traducció automàtica per a les llengües minoritàries sense corpus bilingües. Artetxe treballa ara en la branca d'intel·ligència artificial de Facebook-Meta, no en Google.

Hem provat, traduint un text de l'anunci de Google al llenguatge aimara, i després al basc. Aquí tens les imatges de pantalla:

Una frase ha quedat una mica especial en basca, "si vols ajudar a ajudar a la nit en la pròxima actualització...", però, en fi, tant.

Hem vist que els nous idiomes ja estan en https://translate.google.es/, però no en la finestra inferior de Translate integrada en la pàgina principal del cercador. Els idiomes afegits són:

Aquí estan els nous idiomes que ha afegit Google Translate:

  • Assam, 25 milions de parlants a l'Índia.
  • Aimara, 2 milions de parlants, principalment a Bolívia.
  • Bambara, 14 milions de parlants a Mali i el Senegal.
  • Bhojpuri, 50 milions de parlants a l'Índia, Nepal i la diàspora.
  • Maldivera o Dhivehi, 300.000 parlants, llengua nacional de les Maldives.
  • Dogri, 3 milions de parlants a l'Índia i el Pakistan.
  • Ewe, 7 milions de parlants a Togo i Ghana.
  • Guaraní, 7 milions de parlants, llengua indígena i nacional de Paraguai.
  • Ilocano, 10 milions de parlants en el nord de Filipines.
  • Konkanera, 2 milions de parlants, a l'Índia, als voltants de Goa.
  • La criatura criolla, llengua principal de Sierra Leone.
  • Kurduera (variant de Sorani), 15 milions de parlants a l'Iraq i l'Iran.
  • Lingal, 45 milions de parlants, llengua principal del Congo, que parla també als països veïns.
  • Luganda, 20 milions de parlants a Uganda i Ruanda.
  • L'amor, 34 milions de parlants a l'Índia.
  • Manipurera, 2 milions de parlants a l'Índia.
  • Mizo, 830.000 parlants a l'Índia.
  • 37 milions de parlants a Etiòpia i Kenya.
  • Quítxua, 10 milions de parlants al Perú, als Andes en general i en la diàspora.
  • Sanscrítico, antiga llengua clàssica de l'Índia (el seu "llatí"), que pot contenir fins a 20.000 parlants.
  • Sepedi o pediera, 14 milions de parlants a Sud-àfrica.
  • Tigrinya, 8 milions de parlants a Eritrea i Etiòpia.
  • Tsonga, 7 milions de parlants a Sud-àfrica i països veïns.
  • Twi, 11 milions de parlants a Ghana.

El basc porta 12 anys en Google Translate, que va ser afegit en 2010. Llavors tenia una qualitat raonable, però després ha millorat molt, però creiem que eines com Elia.eus o Batua.eus, creades a Euskal Herria, són millors que Google.


T'interessa pel canal: Google
2024-08-19 | El Salto-Hordago
Amazon, l'immens magatzem d'informació de l'exèrcit israelià
AWS és el núvol d'Amazon i està sent un factor clau en les operacions militars d'Israel.

ChatGPT també sap que els centres de dades ens robaran milions de litres d'aigua
Amb la posada en comú de la intel·ligència artificial, les multinacionals tecnològiques han multiplicat els seus plans per a construir grans centres de dades en el núvol. La petjada ecològica de mega-fabric amb equips informàtics és enorme: a més d'electricitat,... [+]

Com desactivar el seguiment que Google ha inserit en Chrome
Des de fa anys Firefox i Safari bloquegen les cookies de tercers que s'utilitzen per a realitzar el seguiment. Chrome farà el mateix en 2025, però volen aprofitar per a augmentar el seu lideratge en el negoci de la publicitat integrant el seu seguiment en el propi navegador. El... [+]

2024-06-07 | Sustatu
Els resultats de Google han posat de manifest alguns motius perquè el català aparegui menys
En aquesta web es va documentar la caiguda del català i del basc entre 2022-2023 en els resultats de cerca de Google. Alguna cosa que va tenir una certa reparació. Recentment, d'alguns estudis que ens han arribat des de Catalunya, hem conegut alguns motius perquè aquestes... [+]

2024-03-22 | Sustatu
Google rep una multa de 250 milions d'euros a França
L'Autoritat Francesa de la Competència imposa a Google una multa de 250 milions d'euros per violacions greus de la competència del mercat per actuacions en el sector de la publicitat digital.

Es pot utilitzar en basc Matomo, l'alternativa lliure de Google Analytics
Els responsables de les webs volen analitzar el trànsit dels seus visitants, però l'eina Google Analytics més utilitzada per a això té problemes de privacitat i legals. Iametza ha traduït al basc el programari lliure Matomo més utilitzat com a alternativa més ètica.

Dinamarca considera il·legal que Google recopili dades dels alumnes
Com en moltes escoles d'Euskal Herria, a Dinamarca s'utilitzen els Chromebooks i Google Workspace (abans G Suite for Education). No obstant això, sembla que a partir del pròxim curs les coses van canviant, ja que l'agència danesa de protecció de dades ha considerat il·legal... [+]

2024-01-24 | David Lindemann
Aixecar el cap i el puny

Em sembla molt bona la iniciativa “Jaso burua” de Soraluze, que impulsa la necessària conscienciació. La setmana passada vaig estar en la conferència per a pares i mares de nens de primària. Amb el fill major en FP, s'escoltaven poques crítiques sobre l'ús de pantalles... [+]


Els governs utilitzen les comunicacions mòbils per a espionatge, segons un senador americà
El senador estatunidenc Ron Wyden anuncia un mètode d'espiaje fins ara desconegut: les notificacions en el mòbil. Els governs dels EUA i d'altres estats estan utilitzant aquesta tècnica, segons ha anunciat Reuters.

Google millora els seus resultats de cerca en basca per a aconseguir un "millor tractament de les llengües"
La fundació Puntueus va denunciar al juliol que les cerques de Google discriminaven el basc, ja que només en la meitat de les cerques apareixia el basc en primer lloc. Al setembre, el 73% dels resultats ha prioritzat el basc.

2023-07-12 | Sustatu
L'Observatori PuntuEus confirma amb dades el mal causat per Google en les cerques en basca
L'Observatori de la Fundació PuntuEus ha donat a conèixer les dades mesurades el dimarts en 2022 en roda de premsa. A l'acte han assistit Albert Cuesta, coordinador de l'Aliança per la Presència Digital del Català i Luistxo Fernández, president de l'Associació Cultural de... [+]

2023-06-09 | Sustatu
Un informe català demostra el canvi de tendència de Google al castellà
És sabut (ja hem comentat en Sustatu al desembre i gener) que Google discrimina els resultats en basc i català des de l'any passat. Els va prometre als catalans que Google estudiaria l'assumpte. No sembla que hi hagi hagut canvis. Per contra, els catalans van constituir una... [+]

Webs lliures i obertes 30 anys
Es compleixen 30 anys des que el centre de recerca en física CERN va posar a la disposició de tots la xarxa mundial de World Wide Web o pàgines web. El 30 d'abril de 1993 es va posar en domini públic el programari necessari per a crear, allotjar i visitar pàgines web,... [+]

Google dissenya chromebooks per a poc temps
L'organització estatunidenca Public Interest Research Group (PIRG, Grup de Recerca d'Interès Públic) ha arribat a la conclusió que els Chromebooks amb un ús educatiu molt extens estan dissenyats per a poc temps. L'obsolescència programada es considera inacceptable, i si cada... [+]

Han trobat discursos d'odi en el conjunt de dades per a entrenar les eines d'intel·ligència artificial de Facebook i Google
The Washington Post ha analitzat, en col·laboració amb Allen Institute for AI, el conjunt de dades utilitzades per a entrenar les eines d'intel·ligència artificial de Google i Facebook. Entre els milions de continguts presos d'Internet també s'han trobat pàgines web que... [+]

Eguneraketa berriak daude