argia.eus
INPRIMATU
Google Translate: 24 idiomas máis cun novo modelo
  • Google Translate incorpora 24 idiomas ao seu sistema automático de tradución. Hai linguas como o guaraní, o aimara, o bambara ou o ewe de Ghana que o colonialismo esmagou pero non matou.
Sustatu 2022ko maiatzaren 16a

Tecnicamente marcou un novo fito con este incremento de Google, tal e como se explicou nesta nota. A capacidade de tradución destas linguas alcanzouse a través do uso de Cero-Shot Machine Translation, baseado na intelixencia artificial, e caracterízase polo funcionamento deste sistema sen o uso de corpus bilingües. É dicir, Google (din) conseguiu construír o modelo dese idioma usando só textos aymara e habilitalo para traducións.

Pareceunos que este modelo ten relación co traballo e a tese do informático vasco Mikel Artetxe (Tradución automática non supervisada), onde desenvolveu un procedemento de tradución automática para as linguas minoritarias sen corpus bilingües. Artetxe traballa agora na rama de intelixencia artificial de Facebook-Meta, non en Google.

Probamos, traducindo un texto do anuncio de Google á linguaxe aimara, e logo ao eúscaro. Aquí tes as imaxes de pantalla:

Unha frase quedou un pouco especial en eúscaro, "si queres axudar a axudar á noite na próxima actualización...", pero, en fin, tanto.

Habemos visto que os novos idiomas xa están en https://translate.google.é/, pero non na xanela inferior de Translate integrada na páxina principal do buscador. Os idiomas engadidos son:

Aquí están os novos idiomas que engadiu Google Translate:

  • Assam, 25 millóns de falantes na India.
  • Aimara, 2 millóns de falantes, principalmente en Bolivia.
  • Bambara, 14 millóns de falantes en Mali e Senegal.
  • Bhojpuri, 50 millóns de falantes na India, Nepal e a diáspora.
  • Maldivera ou Dhivehi, 300.000 falantes, lingua nacional das Maldivas.
  • Dogri, 3 millóns de falantes en India e Paquistán.
  • Ewe, 7 millóns de falantes en Togo e Ghana.
  • Guaraní, 7 millóns de falantes, lingua indíxena e nacional de Paraguai.
  • Ilocano, 10 millóns de falantes no norte de Filipinas.
  • Konkanera, 2 millóns de falantes, na India, nos arredores de Goa.
  • O crío criollo, lingua principal de Serra Leona.
  • Kurduera (variante de Sorani), 15 millóns de falantes en Iraq e Irán.
  • Lingal, 45 millóns de falantes, lingua principal do Congo, que fala tamén nos países veciños.
  • Luganda, 20 millóns de falantes en Uganda e Rwanda.
  • O amor, 34 millóns de falantes na India.
  • Manipurera, 2 millóns de falantes na India.
  • Mizo, 830.000 falantes na India.
  • 37 millóns de falantes en Etiopía e Kenia.
  • Quechua, 10 millóns de falantes en Perú, en Ándelos en xeral e na diáspora.
  • Sanscrítico, antiga lingua clásica da India (o seu "latín"), que pode conter até 20.000 falantes.
  • Sepedi ou pediera, 14 millóns de falantes en Sudáfrica.
  • Tigrinya, 8 millóns de falantes en Eritrea e Etiopía.
  • Tsonga, 7 millóns de falantes en Sudáfrica e países veciños.
  • Twi, 11 millóns de falantes en Ghana.

O eúscaro leva 12 anos en Google Translate, que foi engadido en 2010. Entón tiña unha calidade razoable, pero logo mellorou moito, pero cremos que ferramentas como Elia.eus ou Batua.eus, creadas en Euskal Herria, son mellores que Google.