Aliança per a Presència Dixital do Català (APDC) constituíuse en marzo baixo a presidencia do xornalista tecnófilo Albert Cuesta. Desde entón, analizáronse os datos das páxinas web de diferentes organizacións e realizáronse procuras sistemáticas desde computadores controlados para analizar empíricamente o caso da discriminación de Google.
Os resultados fixéronse públicos o martes. Nota de prensa aquí e o informe en inglés en PDF aquí.
Velaquí algúns descubrimentos preocupantes que probablemente se poidan traer do caso do catalán ao eúscaro (demostramos que en Sustatun tamén se dá este problema ao eúscaro)
Aquí, nas zonas de contido bilingüe catalán e español, o desequilibrio desenvolvido, medido na perda da visita en catalán. Desde a segunda metade de 2022 a perda de tráfico é especialmente notable.
O descenso do catalán, nunha determinada páxina web (unha organización catal que traballa en diferentes linguas e mirando a diferentes "mercados"), apréciase unha correlación entre a caída do catalán e o aumento do castelán, especialmente a partir de 2022.
O informe conclúe que se produciu un cambio substancial na primavera de 2022. Así mesmo, presenta varios exemplos, coas configuracións de computador en catalán, documentando o resultado de procuras concretas, como nos resultados prefírese o castelán antes que o catalán. Crearon unha galería de imaxes suplementaria que acompaña ao informe. Nós tamén publicamos exemplos en Sustatu...
O informe demostra, por tanto, principalmente:
Por que ocorre isto? No informe menciónanse algunhas hipóteses, e a máis verosímil sería:
"The problem is that is not complying with the users” preferences (“I’d rather like to see pages in Catalan”), xo when content is available in several languages, in multilingual sites, Discards the language preference in the browser or user and which visits which the specimen.
Traducido:
"O problema é que Google non atende ás preferencias lingüísticas dos usuarios ("Oxalá vexa as páxinas en catalán") e, en consecuencia, cando un determinado contido ofrécese en diferentes idiomas, como sitios web multilingües, Google ignora as preferencias lingüísticas no navegador ou no perfil do usuario, e dá máis substitucións á versión do sitio que máis visitas ten, que en consecuencia recibe máis visitas."
Aí está a culler, en definitiva, o noso comportamento é o principal. O efecto Herri Txiki, citado ás veces polos practicantes de Wikipedia en eúscaro, ou o pasado ano nas procuras de nomes de bertsolaris... Os euskaldunes clicamos, aínda que oferte dúas páxinas, máis en castelán en eúscaro. Google chegou á conclusión de que, por encima das preferencias lingüísticas ou de calquera outro tipo, quen recibe máis clics ten máis interese que o resto, polo que o algoritmo opta por ofrecer o castelán antes. Isto, do mesmo xeito que no rodete do rato, fai que o de castelán sexa aínda máis interesante... e niso estamos.
No informe tamén lemos un punto sorprendente: "We are not sure that the issue is also affecting other languages. Actualy a few complaints about Ukrainian have surfaced on Twitter." O informe da Alianza di, pois, que non saben si isto está a ocorrer noutras linguas. En fin, un representante da Alianza reuniuse hai unhas semanas coa subcomisión da sección dixital do Consello Asesor do Eúscaro da CAV e informóuselle de que o eúscaro era o mesmo. Isto esquecer.
De face ao futuro, o informe propón analizar máis cousas, especialmente como se utiliza o parámetro Hreflang de codificación HTML en sitios web multilingües... Trátase dunha cuestión algo abstracta, pero algúns tecnólogos vascos detectaron que no caso de Wikipedia Hreflang non se utiliza de forma estándar (ou a petición de Google). Tema quizais para outro artigo.
Paréceme moi boa a iniciativa “Jaso burua” de Soraluze, que impulsa a necesaria concienciación. A semana pasada estiven na conferencia para pais e nais de nenos de primaria. Co fillo maior en FP, escoitábanse poucas críticas sobre o uso de pantallas (e contidos de... [+]