Txosten katalan batek Googleren gaztelaniaren aldeko joera aldaketa demostratu du

  • Jakina da (komentatu izan dugu Sustatun abenduan eta urtarrilean) Googlek iaztik euskarazko eta katalanezko emaitzak diskriminatzen dituela. Katalanei agindu zien Googlek auzia aztertuko zutela. Ez dirudi aldaketarik gertatu denik. Aldiz, katalanek "Aliantza Digitala" osatu zuten bertako enpresa, erakunde eta talde teknofiloen artean, eta aliantza horren bulegoak lan bat kaleratu berri du, txosten bat demostratzen nola ari den eragiten Googleren emaitza-diskriminazioa.

Artikulu hau CC BY-SA 3.0 lizentziari esker ekarri dugu.

2023ko ekainaren 09an - 07:52
Zarata mediatikoz beteriko garai nahasiotan, merkatu logiketatik urrun eta irakurleengandik gertu dagoen kazetaritza beharrezkoa dela uste baduzu, ARGIA bultzatzera animatu nahi zaitugu. Geroz eta gehiago gara, jarrai dezagun txikitik eragiten.

Aliança per la Presència Digital del Català (APDC) martxoan eratu zen, Albert Cuesta kazetari teknofiloa dela buru. Ordutik hona, hainbat erakunderen webguneen datuak aztertu dituzte, eta ordenagailu kontrolatuetatik bilaketa sistematikoak egin dituzte, Googleren diskriminazioaren kasua enpirikoki aztertzeko.

Asteartez egin dituzte publiko emaitzak. Prentsa oharra hemen eta txostena bera, ingelesez PDF formatuan hemen.

Hona aurkikuntza kezkagarri batzuk, katalanaren kasutik euskarara ekar daitezkeenak seguruenik (demostratu baiugu Sustatun euskarari ere gertatzen zaiola arazo hau)

Hemen, katalanezko eta espainolezko eduki elebiduneko guneetan, nolako desoreka garatu den, katalanezko bisita galeran neurtuta. 2022ko bigarren erditik, trafiko galera bereziki nabarmena da.

Katalaneren beherakada, webgune jakin batean (hizkuntza desberdinetan eta "merkatu" desberdinetara begira lan egiten duen erakunde katala bat), korrelazioa ikusten da katalanaren beherakadaren eta gaztelaniaren gorakadaren artean, 2022tik aurrera bereziki.

2022ko udaberrian gertatu zela aldaketa nabarmen bat ondorioztatu du txostenak. Era berean, hainbat adibide dakartza, ordenagailu konfigurazioak txukun katalanez jarrita bilaketa zehatz batzuen emaitza dokumentatuz, nola emaitzetan gaztelania hobesten den katalanaren aurretik. Irudi galeria gehigarri bat osatu dute, txostenaren lagungarri. Geuk ere argitaratu ditugu adibideak Sustatun...

Txostenak demostratzen du beraz, nagusiki:

  • katalanaren diskriminazioa gertatzen ari dela,
  • 2022ko udaberritik gertatzen ari dela
  • webguneetako bisitetan eragina duela, katalan hutsezkoen bisitak jaitsiz, eta webgune elebidunetan gaztelaniazko bisitak gehituz katalanezkoak jaisten diren proportzio berean.

Hau zergatik gertatzen ote den... Hipotesi batzuk aipatzen dira txostenean, eta egiantza gehien duena hau lutzateke:

"The problem here is that Google is not complying with the users’ preferences (“I’d rather like to see pages in Catalan”), so when a content is available in several languages, as in multilingual sites, Google discards the language preference in the browser or user profile and gives more relevance to the site with more visits, which ends up getting even more visits."

Itzulita:

"Arazoa hemen da Googlek ez diela erabiltzaileen hizkuntza hobespenei kasu egiten ("Nahiago nuke orriak katalanez ikusi") eta ondorioz, eduki jakin bat hizkuntza desberdinetan eskaintzen denean, hala nola webgune eleanitzetan, nabigatzaileko edo erabiltzailearen profileko hizkuntza hobespenei muzin egiten die Googlek, eta errelebantzia gehiago ematen dio bisita gehien duen gune-bertsioari, zeinak, ondorioz, are bisita gehiago jasotzen dituen."

Hortxe dago koxka azken batean, gure portaera da nagusi honetan. Herri Txiki efektua, euskarazko Wikipediako arituek zenbaitetan aipatua, edo iaz bertsolarien izenen bilaketetan gertatua... Euskaldunok klikatzen dugu, bi orri eskainitakoan ere, gehiago gaztelaniazkoan euskarazkoan. Googlek ondorioztatu du, hizkuntza hobespenen edo beste edozerren gainetik, klik gehiago jasotzen dituenak interes gehiago duela besteak baino, eta hortaz, gaztelaniazkoa lehenago eskaintzeko hautua egiten du algoritmoak. Honek, halaber, saguaren gurpilean bezala, gaztelaniazkoa are interesgarriago-klikatuago bilakatzen du... eta horretan gaude.

Txostenean puntu harrigarri bat ere irakurri dugu: "We are not sure that the issue is also affecting other languages. Actually a few complaints about Ukrainian have surfaced on Twitter." Aliantzako txostenak dio, beraz, ez dakitela beste hizkuntza batzuetan gertatzen ari ote den hau. Tira, Aliantzako ordezkari batek izan zuen bilera duela aste batzuk EAEko Euskararen Aholku Batzordeko atal digitaleko azpibatzordearekin, eta jakinarazi zitzaion euskaraz berdina gertatzen zela. Ahaztu egin zaie hau.

Aurrera begira, txostenak gauza gehiago aztertzea proposatzen du, bereziki HTML kodeketako Hreflang parametroa nola erabiltzen den webgune eleanitzetan... Auzi abstruso samarra da, baina euskal teknologoren batzuek detektatu izan dute Wikipediaren kasuan Hreflang ez dela modu estandarrean (edo Googlek eskatutako eran) erabiltzen. Beste artikulu baterako gaia, agian.


Kanal honetatik interesatuko zaizu: Google
ChatGPT-k hau ere badaki: datu zentroek milioika litro ur lapurtuko digute

Adimen artifiziala denen eskueran jartzearekin, multinazional teknologikoek cloud datu zentro erraldoiak eraikitzeko planak ugaritu dituzte. Ekipamendu informatikoz betetako mega-fabrikon aztarna ekologikoa ikaragarria da: elektrizitateaz gain, milioika litro ur behar dute euren... [+]


Nola desaktibatu Googlek Chromen txertatu duen jarraipena

Urteak dira Firefoxek eta Safarik jarraipena egiteko erabiltzen diren hirugarrenen cookieak blokeatzen dituztela. Chromek ere gauza bera egingo du 2025ean, baina publizitatearen negozioan duten nagusitasuna handitzeko aprobetxatu nahi dute, jarraipena nabigatzailean bertan... [+]


2024-06-07 | Sustatu
Googleren emaitzetan katalana gutxiago agertzeko motibo zenbait azaleratu dituzte

Googleren bilaketa emaitzetan katalanak eta euskarak 2022-2023 tartean izan zuten beherakada dokumentatu genuen webgune honetan. Nolabaiteko konponketa izan zuen gauza hark. Oraintsu, Kataluniatik iritsi zaizkigun azterketa batzuetatik, hizkuntza hauek bilaketetan gutxiago... [+]


2024-03-22 | Sustatu
Googleri 250 milioi euroko isuna jarri diote Frantzian

Frantziako Lehiaren Agintaritzak Google-ri 250 milioi euroko isuna ezarri dio, merkatuaren lehiaren urraketa larriengatik, publizitate digitalaren sektorean egindako jarduerak direla-eta.


Google Analytics-en alternatiba librea den Matomo euskaraz erabil daiteke

Webguneen arduradunek beren bisitarien trafikoa aztertu nahi izaten dute, baina horretarako gehien erabiltzen den Google Analytics tresnak pribatutasun eta lege arazoak ditu. Alternatiba etikoago bezala gehien erabiltzen den Matomo software librea euskaratu du Iametzak.


Danimarkak legez kanpokotzat jo du Googlek ikasleen datuak biltzea

Euskal Herriko eskola askotan bezala, Danimarkan ere Chromebook-ak eta Google Workspace (lehen G Suite for Education deitua) erabiltzen dira. Hala ere, datorren ikasturtetik aurrera gauzak aldatzera doazela dirudi, datuen babeserako agentzia daniarrak legez kanpokotzat jo baitu... [+]


2024-01-24 | David Lindemann
Jaso burua, baita ukabila ere

Oso ona iruditzen zait Soraluzeko “Jaso burua” ekimena, ezinbesteko kontzientziazioa bultzatzen baitu. Lehen Hezkuntzako umeen gurasoontzako hitzaldian izan nintzen joan den astean. Seme nagusia LHn zegoela, pantailen (eta pantailen edukien) erabileraren inguruko... [+]


Gobernuek espioitzarako erabiltzen dituzte mugikorreko jakinarazpenak, AEBetako senatari baten arabera

Orain arte ezezaguna zen zelatatzeko metodo baten berri eman du AEBetako Ron Wyden senatariak: mugikorreko jakinarazpenak. AEBetako eta beste estatu batzuetako gobernuak teknika hori erabiltzen ari dira, Reuters-ek jakitera eman duenez.


Euskarazko bilaketa-emaitzak hobetu du Google-k, “hizkuntzen tratamendu egokiagoa” lortzeko

Puntueus fundazioak uztailean salatu zuen Google bilaketek euskara diskriminatzen zutela, bilaketen erdietan baino ez baitzen agertzen euskara lehen tokian. Irailean, berriz, emaitzen %73ak euskara lehenetsi du.


2023-07-12 | Sustatu
PuntuEus Behatokiak Googlek euskarazko bilaketetan eragindako kaltea datuekin baieztatu du

PuntuEus fundazioaren Behatokiak 2022an neurtu zituen datuen berri eman du asteartean prentsaurrekoan. Hauekin batera, Albert Cuesta, Aliança per la Presència Digital del Català erakundearen koordinatzailea eta Luistxo Fernandez, Euskal Wikilarien... [+]


Web libre eta irekiak 30 urte

30 urte bete dira CERN fisikako ikerketa guneak World Wide Web edo webgunez osatutako mundu zabaleko sarea guztion eskura jarri zuenetik. 1993ko apirilaren 30ean webguneak sortu, ostatatu eta bisitatzeko beharrezko softwarea domeinu publikoan jarri zuten, garai berri bati... [+]


Chromebookak gutxi irauteko diseinatu ditu Googlek

Hezkuntzan erabilera oso zabala duten Chromebookak gutxi irauteko diseinatuta daudela ondorioztatu du AEBetako Public Interest Research Group erakundeak (PIRG, Interes publikorako ikerketa taldea). Zaharkitze programatua onartezintzat jo dute, eta ikasle bakoitzak gailu bat... [+]


Gorroto-diskurtsoak aurkitu dituzte Facebook eta Googleren adimen artifizialeko tresnak entrenatzeko datu-multzoan

Googleren eta Facebooken adimen artifizialeko tresnak entrenatzeko erabilitako datu-multzoa aztertu du The Washington Postek, Allen Institute for AI-rekin elkarlanean. Internetetik hartutako milioika edukiren artean gorroto-diskurtsoak bultzatzen dituzten webguneetakoak ere... [+]


Google Analytics erabiltzearen aurkako lehen erabakia Finlandian ere

Finlandiako datuen babeserako erakundeak Helsinkiko udal-liburutegiek webguneetan Google Analytics erabiltzearen aurkako erabakia hartu du. Arrazoia: europarren datu pertsonalak AEBetara bidaltzea legez kanpokoa dela, adibidez, kasu honetan, herritarrek hartutako liburuen eta... [+]


2023-02-01 | Ula Iruretagoiena
Lurraldea eta arkitektura
Desagerturik

Non dago komentatu didazun tokia?", "Google Maps-en". Geolokalizazioa eta kartografiatzen duen mapa, gailu boteretsuak bilakatu dira gure gizartean. Eraginkorrak dira: ligatzeko, erosteko, jateko eta leku batetik bestera mugitzeko. Mapan ez dagoena, existitzen ez... [+]


Eguneraketa berriak daude