argia.eus
INPRIMATU
Un informe català demostra el canvi de tendència de Google al castellà
  • És sabut (ja hem comentat en Sustatu al desembre i gener) que Google discrimina els resultats en basc i català des de l'any passat. Els va prometre als catalans que Google estudiaria l'assumpte. No sembla que hi hagi hagut canvis. Per contra, els catalans van constituir una "Aliança Digital" entre les seves empreses, institucions i grups tecnófilos, l'oficina dels quals acaba de llançar un treball demostrant com està provocant la discriminació de resultats de Google.
Sustatu 2023ko ekainaren 09a

Aliança per la Presència Digital del Català (APDC) es va constituir al març sota la presidència del periodista tecnófilo Albert Cuesta. Des de llavors, s'han analitzat les dades de les pàgines web de diferents organitzacions i s'han realitzat cerques sistemàtiques des d'ordinadors controlats per a analitzar empíricament el cas de la discriminació de Google.

Els resultats s'han fet públics el dimarts. Nota de premsa aquí i l'informe en anglès en PDF aquí.

Heus aquí alguns descobriments preocupants que probablement es poden portar del cas del català al basc (vam demostrar que en Sustatun també es dona aquest problema al basc)

Aquí, en les zones de contingut bilingüe català i espanyol, el desequilibri desenvolupat, mesurat en la pèrdua de la visita en català. Des de la segona meitat de 2022 la pèrdua de trànsit és especialment notable.

El descens del català, en una determinada pàgina web (una organització catal que treballa en diferents llengües i mirant a diferents "mercats"), s'aprecia una correlació entre la caiguda del català i l'augment del castellà, especialment a partir de 2022.

L'informe conclou que es va produir un canvi substancial en la primavera de 2022. Així mateix, presenta diversos exemples, amb les configuracions d'ordinador en català, documentant el resultat de cerques concretes, com en els resultats es prefereix el castellà abans que el català. Han creat una galeria d'imatges suplementària que acompanya a l'informe. Nosaltres també hem publicat exemples en Sustatu...

L'informe demostra, per tant, principalment:

  • la discriminació del català,
  • Des de la primavera de 2022
  • influeix en les visites a les pàgines web, baixant les visites únicament en català i sumand les visites en castellà en les webs bilingües en la mateixa proporció en què les de català descendeixen.

Per què ocorre això? En l'informe s'esmenten algunes hipòtesis, i la més versemblant seria:

"The problem is that is not complying with the users” preferences (“I’d rather like to see pages in Catalan”), sota when content is available in several languages, in multilingual sites, Discards the language preference in the browser or user and which visits which the specimen.

Traduït:

"El problema és que Google no atén les preferències lingüístiques dels usuaris ("Tant de bo vegi les pàgines en català") i, en conseqüència, quan un determinat contingut s'ofereix en diferents idiomes, com a llocs web multilingües, Google ignora les preferències lingüístiques en el navegador o en el perfil de l'usuari, i dona més relleus a la versió del lloc que més visites té, que en conseqüència rep més visites."

Aquí està la cullera, en definitiva, el nostre comportament és el principal. L'efecte Herri Txiki, citat a vegades pels practicants de Wikipedia en basc, o l'any passat en les cerques de noms de bertsolaris... Els euskaldunes cliquem, encara que ofereixi dues pàgines, més en castellà en basc. Google ha arribat a la conclusió que, per sobre de les preferències lingüístiques o de qualsevol altre tipus, qui rep més clics té més interès que la resta, per la qual cosa l'algorisme opta per oferir el castellà abans. Això, igual que en el rodete del ratolí, fa que el de castellà sigui encara més interessant... i en això estem.

En l'informe també llegim un punt sorprenent: "We llauri not sure that the issue is also affecting other languages. Actualy a few complaints about Ukrainian have surfaced on Twitter." L'informe de l'Aliança diu, doncs, que no saben si això està ocorrent en altres llengües. En fi, un representant de l'Aliança es va reunir fa unes setmanes amb la subcomissió de la secció digital del Consell Assessor del Basc de la CAB i se'l va informar que el basc era el mateix. Això se'ls ha oblidat.

De cara al futur, l'informe proposa analitzar més coses, especialment com s'utilitza el paràmetre Hreflang de codificació HTML en llocs web multilingües... Es tracta d'una qüestió una mica abstracta, però alguns tecnòlegs bascos han detectat que en el cas de Wikipedia Hreflang no s'utilitza de manera estàndard (o a petició de Google). Tema potser per a un altre article.