Traducido automaticamente do vasco, a tradución pode conter erros. Máis información aquí. Elhuyarren itzultzaile automatikoaren logoa

Google Translate: 24 idiomas máis cun novo modelo

  • Google Translate incorpora 24 idiomas ao seu sistema automático de tradución. Hai linguas como o guaraní, o aimara, o bambara ou o ewe de Ghana que o colonialismo esmagou pero non matou.
Artikulu hau CC BY-SA 3.0 lizentziari esker ekarri dugu.

16 de maio de 2022 - 09:06

Tecnicamente marcou un novo fito con este incremento de Google, tal e como se explicou nesta nota. A capacidade de tradución destas linguas alcanzouse a través do uso de Cero-Shot Machine Translation, baseado na intelixencia artificial, e caracterízase polo funcionamento deste sistema sen o uso de corpus bilingües. É dicir, Google (din) conseguiu construír o modelo dese idioma usando só textos aymara e habilitalo para traducións.

Pareceunos que este modelo ten relación co traballo e a tese do informático vasco Mikel Artetxe (Tradución automática non supervisada), onde desenvolveu un procedemento de tradución automática para as linguas minoritarias sen corpus bilingües. Artetxe traballa agora na rama de intelixencia artificial de Facebook-Meta, non en Google.

Probamos, traducindo un texto do anuncio de Google á linguaxe aimara, e logo ao eúscaro. Aquí tes as imaxes de pantalla:

Unha frase quedou un pouco especial en eúscaro, "si queres axudar a axudar á noite na próxima actualización...", pero, en fin, tanto.

Habemos visto que os novos idiomas xa están en https://translate.google.é/, pero non na xanela inferior de Translate integrada na páxina principal do buscador. Os idiomas engadidos son:

Aquí están os novos idiomas que engadiu Google Translate:

  • Assam, 25 millóns de falantes na India.
  • Aimara, 2 millóns de falantes, principalmente en Bolivia.
  • Bambara, 14 millóns de falantes en Mali e Senegal.
  • Bhojpuri, 50 millóns de falantes na India, Nepal e a diáspora.
  • Maldivera ou Dhivehi, 300.000 falantes, lingua nacional das Maldivas.
  • Dogri, 3 millóns de falantes en India e Paquistán.
  • Ewe, 7 millóns de falantes en Togo e Ghana.
  • Guaraní, 7 millóns de falantes, lingua indíxena e nacional de Paraguai.
  • Ilocano, 10 millóns de falantes no norte de Filipinas.
  • Konkanera, 2 millóns de falantes, na India, nos arredores de Goa.
  • O crío criollo, lingua principal de Serra Leona.
  • Kurduera (variante de Sorani), 15 millóns de falantes en Iraq e Irán.
  • Lingal, 45 millóns de falantes, lingua principal do Congo, que fala tamén nos países veciños.
  • Luganda, 20 millóns de falantes en Uganda e Rwanda.
  • O amor, 34 millóns de falantes na India.
  • Manipurera, 2 millóns de falantes na India.
  • Mizo, 830.000 falantes na India.
  • 37 millóns de falantes en Etiopía e Kenia.
  • Quechua, 10 millóns de falantes en Perú, en Ándelos en xeral e na diáspora.
  • Sanscrítico, antiga lingua clásica da India (o seu "latín"), que pode conter até 20.000 falantes.
  • Sepedi ou pediera, 14 millóns de falantes en Sudáfrica.
  • Tigrinya, 8 millóns de falantes en Eritrea e Etiopía.
  • Tsonga, 7 millóns de falantes en Sudáfrica e países veciños.
  • Twi, 11 millóns de falantes en Ghana.

O eúscaro leva 12 anos en Google Translate, que foi engadido en 2010. Entón tiña unha calidade razoable, pero logo mellorou moito, pero cremos que ferramentas como Elia.eus ou Batua.eus, creadas en Euskal Herria, son mellores que Google.


Interésache pola canle: Google
2024-08-19 | El Salto-Hordago
Amazon, o inmenso almacén de información do exército israelí
AWS é a nube de Amazon e está a ser un factor crave nas operacións militares de Israel.

ChatGPT tamén sabe que os centros de datos roubarannos millóns de litros de auga
Coa posta en común da intelixencia artificial, as multinacionais tecnolóxicas han multiplicado os seus plans para construír grandes centros de datos na nube. A pegada ecolóxica de mega-fabric con equipos informáticos é enorme: ademais de electricidade, necesitan millóns... [+]

Como desactivar o seguimento que Google inseriu en Chrome
Desde hai anos Firefox e Safari bloquean as cookies de terceiros que se utilizan para realizar o seguimento. Chrome fará o mesmo en 2025, pero queren aproveitar para aumentar o seu liderado no negocio da publicidade integrando o seu seguimento no propio navegador. O grupo NOYB... [+]

2024-06-07 | Sustatu
Os resultados de Google puxeron de manifesto algúns motivos para que o catalán apareza menos
Nesta web documentouse a caída do catalán e do eúscaro entre 2022-2023 nos resultados de procura de Google. Algo que tivo certa reparación. Recentemente, dalgúns estudos que nos chegaron desde Cataluña, coñecemos algúns motivos para que estas linguas aparezan menos nas... [+]

2024-03-22 | Sustatu
Google recibe unha multa de 250 millóns de euros en Francia
A Autoridade Francesa da Competencia impón a Google unha multa de 250 millóns de euros por violacións graves da competencia do mercado por actuacións no sector da publicidade dixital.

Pódese utilizar en eúscaro Matomo, a alternativa libre de Google Analytics
Os responsables das webs queren analizar o tráfico dos seus visitantes, pero a ferramenta Google Analytics máis utilizada para iso ten problemas de privacidade e legais. Iametza traduciu ao euskera o software libre Matomo máis utilizado como alternativa máis ética.

Dinamarca considera ilegal que Google recompile datos dos alumnos
Como en moitas escolas de Euskal Herria, en Dinamarca utilízanse os Chromebooks e Google Workspace (antes G Suite for Education). Con todo, parece que a partir do próximo curso as cousas van cambiando, xa que a axencia danesa de protección de datos considerou ilegal o uso que... [+]

2024-01-24 | David Lindemann
Levantar a cabeza e o puño

Paréceme moi boa a iniciativa “Jaso burua” de Soraluze, que impulsa a necesaria concienciación. A semana pasada estiven na conferencia para pais e nais de nenos de primaria. Co fillo maior en FP, escoitábanse poucas críticas sobre o uso de pantallas (e contidos de... [+]


Os gobernos utilizan as comunicacións móbiles para espionaxe, segundo un senador americano
O senador estadounidense Ron Wyden anuncia un método de espiaje até agora descoñecido: as notificacións no móbil. Os gobernos de EE UU e doutros estados están a utilizar esta técnica, segundo anunciou Reuters.

Google mellora os seus resultados de procura en eúscaro para conseguir un "mellor tratamento das linguas"
A fundación Puntueus denunciou en xullo que as procuras de Google discriminaban ao eúscaro, xa que só na metade das procuras aparecía o eúscaro en primeiro lugar. En setembro, o 73% dos resultados priorizou o eúscaro.

2023-07-12 | Sustatu
O Observatorio PuntuEus confirma con datos o dano causado por Google nas procuras en eúscaro
O Observatorio da Fundación PuntuEus deu a coñecer os datos medidos o martes en 2022 en rolda de prensa. Ao acto asistiron Albert Cuesta, coordinador da Aliança per a Presència Dixital do Català e Luistxo Fernández, presidente da Asociación Cultural de Wikilaris Vascos... [+]

2023-06-09 | Sustatu
Un informe catalán demostra o cambio de tendencia de Google ao castelán
É sabido (xa comentamos en Sustatu en decembro e xaneiro) que Google discrimina os resultados en eúscaro e catalán desde o ano pasado. Prometeulles aos cataláns que Google estudaría o asunto. Non parece que haxa cambios. Pola contra, os cataláns constituíron unha "Alianza... [+]

Webs libres e abertas 30 anos
Cúmprense 30 anos desde que o centro de investigación en física CERN puxo a disposición de todos a rede mundial de World Wide Web ou páxinas web. O 30 de abril de 1993 púxose en dominio público o software necesario para crear, aloxar e visitar páxinas web, iniciando unha... [+]

Google deseña chromebooks para pouco tempo
A organización estadounidense Public Interest Research Group (PIRG, Grupo de Investigación de Interese Público) chegou á conclusión de que os Chromebooks cun uso educativo moi extenso están deseñados para pouco tempo. A obsolescencia programada considérase inaceptable, e... [+]

Atoparon discursos de odio no conxunto de datos para adestrar as ferramentas de intelixencia artificial de Facebook e Google
The Washington Post analizou, en colaboración con Allen Institute for AI, o conxunto de datos utilizados para adestrar as ferramentas de intelixencia artificial de Google e Facebook. Entre os millóns de contidos tomados de Internet tamén se atoparon páxinas web que... [+]

Eguneraketa berriak daude