argia.eus
INPRIMATU
Os resultados de Google puxeron de manifesto algúns motivos para que o catalán apareza menos
  • Nesta web documentouse a caída do catalán e do eúscaro entre 2022-2023 nos resultados de procura de Google. Algo que tivo certa reparación. Recentemente, dalgúns estudos que nos chegaron desde Cataluña, coñecemos algúns motivos para que estas linguas aparezan menos nas procuras. Por unha banda, nalgúns parámetros de Google había unha "trampilla". Doutra banda, hai empresas bilingües en Cataluña que impiden que aparezan os resultados de páxinas de apropos cataláns.
Sustatu 2024ko ekainaren 07a
O que facía (ou o que ten) Google

O pasado 28 de maio filtrouse á rede un documento explicativo do algoritmo de procura de Google. Un programador catalán analiza o problema das procuras lingüísticas.

Segundo esta lectura de Forat Negre, por encima da linguaxe do usuario e da procura, en moitos contextos predomina a lingua do país; na maioría dos casos os países son estados (España é unha desas entidades rexionais para Google, non Euskal Herria ou Cataluña).

Así mesmo, Forat Negre atopou o sinal dalgúns cambios no código que debían introducirse en outubro de 2022. A cronoloxía coincide cos problemas máis ou menos graves que se iniciaron entón para o catalán e o eúscaro.

Posición de domesticación dalgunhas empresas catalás

Outro desarrollador que traballa con tecnoloxías catalás ampliou o dato: algunhas empresas bloquean intencionadamente o catalán. É dicir, teñen páxinas en catalán nos seus sitios web multilingües, pero a través do documento robots.txt piden aos buscadores que non exploren as páxinas en catalán (Google e outros).

Robots.txt é un documento ou unha función que se atopa na maioría de sitios web, ofrecendo instrucións aos buscadores sobre que indexar e que non na súa web. Realízase con fins prácticos para que os usuarios que utilizan os buscadores poidan localizarlle a través de Google.

Revisando os documentos Robots.txt de carácter público, o amigo Wecoc1 anunciou que hai empresas catalás que non queren que os seus contidos se indexen en catalán. Por exemplo, os fabricantes de produtos de fontanaría dos baños de Roca, tal e como mostra a figura superior.

De feito, aí tedes o documento Robots de Roca, e comprobaredes que as páxinas que se poden marcar en eúscaro (o 'eu' é o código internacional ISO do eúscaro) tamén están recortadas... Curioso, porque se mencionan URLs como https://www.roca.es/eu/showrooms ou outras non existen versións en eúscaro ou sitios web nese sitio... Seica existiu e se arrepentieron?

Actualización 7 de xuño: Informáronnos que algunhas empresas vascas tamén o fan, aplicado á indexación en eúscaro, por exemplo Eroski cos seus robots.txt.