Google Translate: 24 hizkuntza gehiago, eredu berri batekin

  • Google Translatek 24 hizkuntza gehitu dizkio bere itzulpen sistema automatikoari. Kolonialismoak zanpatu baina hil ez zituen Afrika eta Amerikako hizkuntza batzuk daude tartean, hala nola guarani, aimara, bambara edo ewe hizkuntza Ghanakoa.

Artikulu hau CC BY-SA 3.0 lizentziari esker ekarri dugu.

2022ko maiatzaren 16an - 09:06

Teknikoki ere mugarri berria ezarri du Google gehikuntza honekin, ohar honetan azaldu dutenez. Adimen artifizialean oinarritutako Zero-Shot Machine Translation erabiliz lortu dute hizkuntza hauek itzultzeko gaitasuna, eta bere ezaugarri nagusia da corpus elebidunak erabili gabe funtzionatzen duela sistema horrek. Hau da, aymara testuak bakarrik erabilita lortu du Googlek (diotenez) hizkuntza horren modeloa eraiki, eta itzulpenetarako gaitu.

Iruditu zaigu modelo horrek baduela erlaziorik Mikel Artetxe informatikari euskaldunaren lan eta tesiarekin (Itzulpen automatiko gainbegiratu gabea), non korpus elebidunik gabeko hizkuntza txikientzako itzulpen automatikoko prozedura bat landu zuen. Artetxe Facebook-Metako adimen artifizialeko adarrean ari da lanean orain, ez Googlen.

Aproba egin dugu, Googleren iragarpeneko testu bat aimara hizkuntzara itzultzen, eta gero hori euskarara. Hemen pantaila irudiak:

Esaldi bat berezi samar geratu da euskaraz, "hurrengo eguneratzean gaua laguntzen lagundu nahi baduzu...", baina tira, hainbestean.

Ikusi dugu https://translate.google.es/ helbidean daudela jada hizkuntza berriak, ez ordea bilatzaileko orri nagusian integratutako Translate leiho txikiagoan. Gehitutako hizkuntzak hauek dira:

Hemen daude Google Translatek gehitu dituen hizkuntza berriak:

  • Assamera, 25 milioi hiztun Indian.
  • Aimara, 2 milioi hiztun, nagusiki Bolivian.
  • Bambara, 14 milioi hiztun Mali eta Senegalen.
  • Bhojpuri, 50 milioi hiztun India, Nepal eta diasporan.
  • Maldivera edo Dhivehi delakoa, 300.000 hiztun, Maldivetako hizkuntza nazionala.
  • Dogri, 3 milioi hiztun India eta Pakistanen.
  • Ewe, 7 milioi hiztun Togo eta Ghanan.
  • Guaraniera, 7 milioi hiztun, Paraguaiko hizkuntza indigena eta nazionala.
  • Ilocano, 10 milioi hiztun Filipinas iparraldean.
  • Konkanera, 2 milioi hiztun, Indian, Goa inguruan.
  • Krio kreolera, Sierra Leonako hizkuntza nagusia.
  • Kurduera (Sorani aldaera), 15 milioi hiztun Irak eta Iranen.
  • Lingala, 45 milioi hiztun, Kongoko hizkuntza nagusia, inguruko herrialdeetan ere mintzatzen dena.
  • Luganda, 20 milioi hiztun Uganda eta Rwandan.
  • Maithiliera, 34 miloi hiztun Indian.
  • Manipurera, 2 milioi miloi hiztun Indian.
  • Mizo, 830.000 hiztun Indian.
  • Oromoera, 37 milio hiztun Etiopian eta Kenian.
  • Kitxua, 10 milioi hiztun Perun, Andeetan oro har eta diasporan.
  • Sanskritoa, Indiako antzinako hizkuntza klasikoa (bertako "latina"), 20.000 hiztun ere izan ditzakeena.
  • Sepedi edo pediera, 14 milioi hiztun Hego Afrikan.
  • Tigrinya, 8 milioi hiztun Eritrea eta Etiopian.
  • Tsonga, 7 milioi hiztun Hego Afrikan eta inguruko herrialdeetan.
  • Twi, 11 milioi hiztun Ghanan.

Euskarak 12 urte juxtu daramatza Google Translaten, 2010ean gehitu zuten. Orduan halamoduzko kalitatea zuen, baina gero asko hobetu du; hala ere, uste dugu Elia.eus edo Batua.eus bezalako tresnak, Euskal Herrian sortuak, hobeak direla Google baino.


Kanal honetatik interesatuko zaizu: Google
2024-09-16 | Sustatu
EAEko Hezkuntza Sailak datuen babesa egoki bete gabe egin zuen hitzarmena Google Workspace for Education erabiltzeko

Udako albistea da, zenbait tokitan agertu zena, Datuak Babesteko Euskal Agintaritzak (DBEA, Euskal Autonomia Erkidegoko administrazio-organo bat) Eusko Jaurlaritzako Hezkuntza sailari espedientea ireki ziola Googleren produktu batzuk erabiltzera behartzeagatik ikasleen... [+]


Europak 15.000 milioi euroko isuna jarri die Apple eta Google multinazionalei

Europar Batasuneko Justizia Auzitegiak Apple eta Irlanda kasua ebatzi, eta Googleren aurkako zigorra berretsi du, nagusitasunezko posizioaz abusatzeagatik.


2024-08-19 | El Salto-Hordago
Amazon, Israelgo armadaren informazio biltegi amaigabea

Amazonen hodeia da AWS, eta funtsezko faktorea izaten ari da Israelen operazio militarretan.


ChatGPT-k hau ere badaki: datu zentroek milioika litro ur lapurtuko digute

Adimen artifiziala denen eskueran jartzearekin, multinazional teknologikoek cloud datu zentro erraldoiak eraikitzeko planak ugaritu dituzte. Ekipamendu informatikoz betetako mega-fabrikon aztarna ekologikoa ikaragarria da: elektrizitateaz gain, milioika litro ur behar dute euren... [+]


Nola desaktibatu Googlek Chromen txertatu duen jarraipena

Urteak dira Firefoxek eta Safarik jarraipena egiteko erabiltzen diren hirugarrenen cookieak blokeatzen dituztela. Chromek ere gauza bera egingo du 2025ean, baina publizitatearen negozioan duten nagusitasuna handitzeko aprobetxatu nahi dute, jarraipena nabigatzailean bertan... [+]


2024-06-07 | Sustatu
Googleren emaitzetan katalana gutxiago agertzeko motibo zenbait azaleratu dituzte

Googleren bilaketa emaitzetan katalanak eta euskarak 2022-2023 tartean izan zuten beherakada dokumentatu genuen webgune honetan. Nolabaiteko konponketa izan zuen gauza hark. Oraintsu, Kataluniatik iritsi zaizkigun azterketa batzuetatik, hizkuntza hauek bilaketetan gutxiago... [+]


2024-03-22 | Sustatu
Googleri 250 milioi euroko isuna jarri diote Frantzian

Frantziako Lehiaren Agintaritzak Google-ri 250 milioi euroko isuna ezarri dio, merkatuaren lehiaren urraketa larriengatik, publizitate digitalaren sektorean egindako jarduerak direla-eta.


Google Analytics-en alternatiba librea den Matomo euskaraz erabil daiteke

Webguneen arduradunek beren bisitarien trafikoa aztertu nahi izaten dute, baina horretarako gehien erabiltzen den Google Analytics tresnak pribatutasun eta lege arazoak ditu. Alternatiba etikoago bezala gehien erabiltzen den Matomo software librea euskaratu du Iametzak.


Danimarkak legez kanpokotzat jo du Googlek ikasleen datuak biltzea

Euskal Herriko eskola askotan bezala, Danimarkan ere Chromebook-ak eta Google Workspace (lehen G Suite for Education deitua) erabiltzen dira. Hala ere, datorren ikasturtetik aurrera gauzak aldatzera doazela dirudi, datuen babeserako agentzia daniarrak legez kanpokotzat jo baitu... [+]


2024-01-24 | David Lindemann
Jaso burua, baita ukabila ere

Oso ona iruditzen zait Soraluzeko “Jaso burua” ekimena, ezinbesteko kontzientziazioa bultzatzen baitu. Lehen Hezkuntzako umeen gurasoontzako hitzaldian izan nintzen joan den astean. Seme nagusia LHn zegoela, pantailen (eta pantailen edukien) erabileraren inguruko... [+]


Gobernuek espioitzarako erabiltzen dituzte mugikorreko jakinarazpenak, AEBetako senatari baten arabera

Orain arte ezezaguna zen zelatatzeko metodo baten berri eman du AEBetako Ron Wyden senatariak: mugikorreko jakinarazpenak. AEBetako eta beste estatu batzuetako gobernuak teknika hori erabiltzen ari dira, Reuters-ek jakitera eman duenez.


Euskarazko bilaketa-emaitzak hobetu du Google-k, “hizkuntzen tratamendu egokiagoa” lortzeko

Puntueus fundazioak uztailean salatu zuen Google bilaketek euskara diskriminatzen zutela, bilaketen erdietan baino ez baitzen agertzen euskara lehen tokian. Irailean, berriz, emaitzen %73ak euskara lehenetsi du.


2023-07-12 | Sustatu
PuntuEus Behatokiak Googlek euskarazko bilaketetan eragindako kaltea datuekin baieztatu du

PuntuEus fundazioaren Behatokiak 2022an neurtu zituen datuen berri eman du asteartean prentsaurrekoan. Hauekin batera, Albert Cuesta, Aliança per la Presència Digital del Català erakundearen koordinatzailea eta Luistxo Fernandez, Euskal Wikilarien... [+]


2023-06-09 | Sustatu
Txosten katalan batek Googleren gaztelaniaren aldeko joera aldaketa demostratu du

Jakina da (komentatu izan dugu Sustatun abenduan eta urtarrilean) Googlek iaztik euskarazko eta katalanezko emaitzak diskriminatzen dituela. Katalanei agindu zien Googlek auzia aztertuko zutela. Ez dirudi aldaketarik gertatu denik. Aldiz, katalanek "Aliantza Digitala"... [+]


Web libre eta irekiak 30 urte

30 urte bete dira CERN fisikako ikerketa guneak World Wide Web edo webgunez osatutako mundu zabaleko sarea guztion eskura jarri zuenetik. 1993ko apirilaren 30ean webguneak sortu, ostatatu eta bisitatzeko beharrezko softwarea domeinu publikoan jarri zuten, garai berri bati... [+]


Eguneraketa berriak daude