Googleren emaitzetan katalana gutxiago agertzeko motibo zenbait azaleratu dituzte

  • Googleren bilaketa emaitzetan katalanak eta euskarak 2022-2023 tartean izan zuten beherakada dokumentatu genuen webgune honetan. Nolabaiteko konponketa izan zuen gauza hark. Oraintsu, Kataluniatik iritsi zaizkigun azterketa batzuetatik, hizkuntza hauek bilaketetan gutxiago agertzeko motibo batzuen berri jakin dugu. Batetik, Googleren parametro batzuetan bazegoen "tranpatxo" bat. Bestetik, badira enpresa elebidunak Katalunian, apropos katalanezko orrien emaitzak agertzea eragozten dutenak.

Artikulu hau CC BY-SA 3.0 lizentziari esker ekarri dugu.

2024ko ekainaren 07an - 07:30
Googlek egiten zuena (edo duena)

Pasa den maiatzaren 28an sarera filtratu zen Googleren bilaketa algoritmoaren azalpen dokumentu bat. Programatzaile katalan batek zabaldutakoa aztertu du, hain zuzen ere hizkuntza-bilaketen problema hura gogoan.

Forat Negreren irakurketa honen arabera, erabiltzailearen eta bilaketaren hizkuntzaren gainetik, kontestu askotan herrialdeko hizkuntza nagusitzen da; herrialdeak gehienetan estatuak direlarik (Espainia bada entitate erregional horietako bat Googlerentzat, ez Euskal Herria edo Katalunia).

Era berean, Forat Negrek aurkitu du kodean 2022ko urrian sartu behar ziren aldaketa batzuen seinalea. Kronologia bat dator: katalanarentzat eta euskararentzat orduan hasi ziren problema larri samarrak.

Kataluniako enpresa batzuen etxekalte jarrera

Katalanezko teknologiekin lan egiten duen beste garatzaile batek zabaldu du beste datua: enpresa batzuek nahita blokeatzen dute katalana. Hau da, orriak dituzte katalanez beren webgune eleanitzetan, baina robots.txt dokumentuaren bidez, katalanezkoak ez arakatzeko eskatzen diete bilatzaileei (Google eta besteei).

Robots.txt da dokumentu edo funtzio bat egoten dena webgune gehienetan, gidalerroak eskainiz bilatzaileei zer indexatu behar duten eta zer ez norberaren webgunean. Helburu praktikoz egin ohi da, bilatzaileak erabiltzen dituzten erabiltzaileek Google bitartez aurki zaitzaten.

Robots.txt dokumentuak publikoak dira, eta horiek arakatuz jakinarazi du Wecoc1 lagunak zenbait enpresa katalanek ez dutela nahi beren edukiak katalanez indexatu daitezen. Adibidez, Roca komunetako iturgintzako produktuen fabrikatzaileak, goiko irudiak erakusten duen bezala.

Hain zuzen ere, hor duzue Rocaren Robots dokumentua, eta ikusiko duzue, nonbait /eu/ markatutako euskarazko orriak izan daitezkeenak ('eu' da euskararen nazioarteko ISO kodea) ere moztuta daudela... Bitxia, ze aipatzen diren URL-ak hala nola https://www.roca.es/eu/showrooms edo besteak ez dauden, ez da existitzen euskarazko bertsiorik edo webgunerik gune horretan... Akaso existitu zen eta damutu ziren?

Eguneraketa, ekainak 7: Jakinarazi digute euskal enpresa batzuek ere egiten dutela hau, euskarazko indexazioari aplikatuta, esate baterako Eroskik bere robots.txt-arekin.


Irakurrienak
Matomo erabiliz
Azoka
Kanal honetatik interesatuko zaizu: Google
2024-09-16 | Sustatu
EAEko Hezkuntza Sailak datuen babesa egoki bete gabe egin zuen hitzarmena Google Workspace for Education erabiltzeko

Udako albistea da, zenbait tokitan agertu zena, Datuak Babesteko Euskal Agintaritzak (DBEA, Euskal Autonomia Erkidegoko administrazio-organo bat) Eusko Jaurlaritzako Hezkuntza sailari espedientea ireki ziola Googleren produktu batzuk erabiltzera behartzeagatik ikasleen... [+]


Europak 15.000 milioi euroko isuna jarri die Apple eta Google multinazionalei

Europar Batasuneko Justizia Auzitegiak Apple eta Irlanda kasua ebatzi, eta Googleren aurkako zigorra berretsi du, nagusitasunezko posizioaz abusatzeagatik.


2024-08-19 | El Salto-Hordago
Amazon, Israelgo armadaren informazio biltegi amaigabea

Amazonen hodeia da AWS, eta funtsezko faktorea izaten ari da Israelen operazio militarretan.


ChatGPT-k hau ere badaki: datu zentroek milioika litro ur lapurtuko digute

Adimen artifiziala denen eskueran jartzearekin, multinazional teknologikoek cloud datu zentro erraldoiak eraikitzeko planak ugaritu dituzte. Ekipamendu informatikoz betetako mega-fabrikon aztarna ekologikoa ikaragarria da: elektrizitateaz gain, milioika litro ur behar dute euren... [+]


Nola desaktibatu Googlek Chromen txertatu duen jarraipena

Urteak dira Firefoxek eta Safarik jarraipena egiteko erabiltzen diren hirugarrenen cookieak blokeatzen dituztela. Chromek ere gauza bera egingo du 2025ean, baina publizitatearen negozioan duten nagusitasuna handitzeko aprobetxatu nahi dute, jarraipena nabigatzailean bertan... [+]


2024-03-22 | Sustatu
Googleri 250 milioi euroko isuna jarri diote Frantzian

Frantziako Lehiaren Agintaritzak Google-ri 250 milioi euroko isuna ezarri dio, merkatuaren lehiaren urraketa larriengatik, publizitate digitalaren sektorean egindako jarduerak direla-eta.


Google Analytics-en alternatiba librea den Matomo euskaraz erabil daiteke

Webguneen arduradunek beren bisitarien trafikoa aztertu nahi izaten dute, baina horretarako gehien erabiltzen den Google Analytics tresnak pribatutasun eta lege arazoak ditu. Alternatiba etikoago bezala gehien erabiltzen den Matomo software librea euskaratu du Iametzak.


Danimarkak legez kanpokotzat jo du Googlek ikasleen datuak biltzea

Euskal Herriko eskola askotan bezala, Danimarkan ere Chromebook-ak eta Google Workspace (lehen G Suite for Education deitua) erabiltzen dira. Hala ere, datorren ikasturtetik aurrera gauzak aldatzera doazela dirudi, datuen babeserako agentzia daniarrak legez kanpokotzat jo baitu... [+]


2024-01-24 | David Lindemann
Jaso burua, baita ukabila ere

Oso ona iruditzen zait Soraluzeko “Jaso burua” ekimena, ezinbesteko kontzientziazioa bultzatzen baitu. Lehen Hezkuntzako umeen gurasoontzako hitzaldian izan nintzen joan den astean. Seme nagusia LHn zegoela, pantailen (eta pantailen edukien) erabileraren inguruko... [+]


Gobernuek espioitzarako erabiltzen dituzte mugikorreko jakinarazpenak, AEBetako senatari baten arabera

Orain arte ezezaguna zen zelatatzeko metodo baten berri eman du AEBetako Ron Wyden senatariak: mugikorreko jakinarazpenak. AEBetako eta beste estatu batzuetako gobernuak teknika hori erabiltzen ari dira, Reuters-ek jakitera eman duenez.


Euskarazko bilaketa-emaitzak hobetu du Google-k, “hizkuntzen tratamendu egokiagoa” lortzeko

Puntueus fundazioak uztailean salatu zuen Google bilaketek euskara diskriminatzen zutela, bilaketen erdietan baino ez baitzen agertzen euskara lehen tokian. Irailean, berriz, emaitzen %73ak euskara lehenetsi du.


2023-07-12 | Sustatu
PuntuEus Behatokiak Googlek euskarazko bilaketetan eragindako kaltea datuekin baieztatu du

PuntuEus fundazioaren Behatokiak 2022an neurtu zituen datuen berri eman du asteartean prentsaurrekoan. Hauekin batera, Albert Cuesta, Aliança per la Presència Digital del Català erakundearen koordinatzailea eta Luistxo Fernandez, Euskal Wikilarien... [+]


2023-06-09 | Sustatu
Txosten katalan batek Googleren gaztelaniaren aldeko joera aldaketa demostratu du

Jakina da (komentatu izan dugu Sustatun abenduan eta urtarrilean) Googlek iaztik euskarazko eta katalanezko emaitzak diskriminatzen dituela. Katalanei agindu zien Googlek auzia aztertuko zutela. Ez dirudi aldaketarik gertatu denik. Aldiz, katalanek "Aliantza Digitala"... [+]


Web libre eta irekiak 30 urte

30 urte bete dira CERN fisikako ikerketa guneak World Wide Web edo webgunez osatutako mundu zabaleko sarea guztion eskura jarri zuenetik. 1993ko apirilaren 30ean webguneak sortu, ostatatu eta bisitatzeko beharrezko softwarea domeinu publikoan jarri zuten, garai berri bati... [+]


Chromebookak gutxi irauteko diseinatu ditu Googlek

Hezkuntzan erabilera oso zabala duten Chromebookak gutxi irauteko diseinatuta daudela ondorioztatu du AEBetako Public Interest Research Group erakundeak (PIRG, Interes publikorako ikerketa taldea). Zaharkitze programatua onartezintzat jo dute, eta ikasle bakoitzak gailu bat... [+]


Eguneraketa berriak daude