argia.eus
INPRIMATU
Els resultats de Google han posat de manifest alguns motius perquè el català aparegui menys
  • En aquesta web es va documentar la caiguda del català i del basc entre 2022-2023 en els resultats de cerca de Google. Alguna cosa que va tenir una certa reparació. Recentment, d'alguns estudis que ens han arribat des de Catalunya, hem conegut alguns motius perquè aquestes llengües apareguin menys en les cerques. D'una banda, en alguns paràmetres de Google hi havia una "trapa". D'altra banda, hi ha empreses bilingües a Catalunya que impedeixen que apareguin els resultats de pàgines d'apropos catalans.
Sustatu 2024ko ekainaren 07a
El que feia (o el que té) Google

El passat 28 de maig es va filtrar a la xarxa un document explicatiu de l'algorisme de cerca de Google. Un programador català analitza el problema de les cerques lingüístiques.

Segons aquesta lectura de Forat Negre, per sobre del llenguatge de l'usuari i de la cerca, en molts contextos predomina la llengua del país; en la majoria dels casos els països són estats (Espanya és una d'aquestes entitats regionals per a Google, no Euskal Herria o Catalunya).

Així mateix, Forat Negre ha trobat el senyal d'alguns canvis en el codi que havien d'introduir-se a l'octubre de 2022. La cronologia coincideix amb els problemes més o menys greus que es van iniciar llavors per al català i el basc.

Posició de domesticació d'algunes empreses catalanes

Un altre desenvolupador que treballa amb tecnologies catalanes ha ampliat la dada: algunes empreses bloquegen intencionadament el català. És a dir, tenen pàgines en català en els seus llocs web multilingües, però a través del document robots.txt demanen als cercadors que no explorin les pàgines en català (Google i altres).

Robots.txt és un document o una funció que es troba en la majoria de llocs web, oferint instruccions als cercadors sobre què indexar i què no en el seu web. Es realitza amb finalitats pràctics perquè els usuaris que utilitzen els cercadors puguin localitzar-li a través de Google.

Revisant els documents Robots.txt de caràcter públic, l'amic Wecoc1 ha anunciat que hi ha empreses catalanes que no volen que els seus continguts s'indexin en català. Per exemple, els fabricants de productes de lampisteria dels banys de Roca, tal com mostra la figura superior.

De fet, aquí teniu el document Robots de Roca, i comprovareu que les pàgines que es poden marcar en basca (l'eu '' és el codi internacional ISO del basc) també estan retallades... Curiós, perquè s'esmenten URLs com https://www.roca.es/eu/showrooms o altres no existeixen versions en basca o llocs web en aquest lloc... Potser va existir i s'arrepentieron?

Actualització 7 de juny: Ens han informat que algunes empreses basques també ho fan, aplicat a la indexació en basca, com per exemple Eroski amb el seu robots.txt.