Common Voice é unha iniciativa da Fundación Mozilla que ten como obxectivo crear mellores tecnoloxías de coñecemento da voz e que sexan accesibles para todos. Cada vez é máis habitual utilizar a voz para interactuar coas máquinas, pero até agora os sistemas (Google Assistant, Apple Siri, Microsoft Cortana, Amazon Alexa...) teñen moitos problemas:
Só poden utilizarse nas linguas máis estendidas. As grandes empresas que teñen detrás só miran aos beneficios económicos e as linguas pequenas non son viables para eles. No caso de que non xurdan alternativas, os vascos deberemos falar en castelán á televisión, aos teléfonos móbiles e a outros dispositivos. O mesmo ocorreralles por centos de millóns de persoas doutras linguas minoritarias en todo o mundo.
Common Voice estará dispoñible no maior número de idiomas posible, potencialmente en calquera idioma. 20 idiomas xa están a realizar gravacións de voz e outros 70 máis están a preparar para iso. A tecnoloxía permitiranos falar na nosa lingua materna aos vascos e a outras comunidades lingüísticas do mundo como a nosa.
Non teñen en conta a diversidade de voces. Falar un idioma principal non garante que o dispositivo entenda a túa voz. Se falas con acento ou es muller terás máis dificultades, xa que a maioría das voces que se utilizaron historicamente para adestrar a estes motores foron de homes brancos de clase media.
Common Voic quere ter en conta todo tipo de voces. Por iso queremos que o recoñecemento de voz en eúscaro sexa o máis variado posible: mulleres e homes, de todas as idades, euskaldunberris e euskaldunzaharras, de todos os recunchos de Euskal Herria...
Escoitan constantemente e envían ao servidor as gravacións das nosas voces. Son un pesadelo desde o punto de vista da privacidade. “Pola nosa vontade” son os espías que metemos en casa. Ao ser un software propietario, os usuarios non podemos saber que se fai coas nosas gravacións de voz no dispositivo e non temos ningún control sobre o que ocorre no servidor. As grandes empresas obteñen beneficios a través da venda de datos privados da cidadanía.
Common Voic dará prioridade á privacidade, non enviará a nosa voz a ningún sitio. O procesamiento de voz realizarase no propio dispositivo. A nosa voz non será enviada, analizada ou monitorizada. Os proxectos de software libre demostran que a tecnoloxía pode xurdir doutra maneira, pondo como obxectivo as necesidades e os dereitos da cidadanía.
Si queres saber máis sobre Common Voice recomendámosche que leas a páxina Preguntas frecuentes do proxecto.
Para poder falar en eúscaro coa tecnoloxía necesítanse unhas 10.000 horas de voz para adestrar o motor. Para iso, Librezal fixo un chamamento á auzolan dixital, onde os traballadores poderán participar. Si queres participar podes facer as gravacións a calquera hora e desde calquera lugar:
Tamén pode axudar a validar as gravacións que xa se realizaron. Para iso, pulse "Escoitar" e siga as instrucións. É moi sinxelo e podes facelo desde un computador ou desde o teu móbil. Iso si, recomendámosche que as graves nun lugar silencioso para que as gravacións sexan de boa calidade.
Dentro deste auzolan dixital organizamos un maratón de gravación en colaboración con Librezale e Hirikilabs. Será en Tabakalera (Donostia-San Sebastián) o 9 de abril, de 18:00 a 20:00 horas. Anímache e participa!
Como empresa que integra tecnoloxía, deseño e comunicación fomentamos as tecnoloxías libres e o eúscaro é un valor para nós. Por iso, esforzámonos en que o eúscaro teña tamén presenza nas tecnoloxías avanzadas. Por tanto, cremos necesario promover este tipo de proxectos participativos e libres, para que, como neste caso, no futuro poidamos ter nas nosas mans diferentes produtos para comunicarse en eúscaro coas máquinas e que o eúscaro non sexa un idioma de segunda.
Parécenos importante dar pasos no ámbito da soberanía tecnolóxica e construír alternativas como país ante as grandes compañías. A organización deste maratón non é o primeiro paso que damos nese camiño, por exemplo, o ano pasado Mastodon.eus colaboramos na posta en marcha dunha rede social en euskera alternativa a Twitter.
Antes de comezar coa fase de gravacións de voz, había que reunir 5.000 frases de entre cinco e dez palabras. As frases debían ter unha licenza Creative Commons Zero (CC0), algo equivalente a estar na propiedade pública, o que engadía dificultade á obra. Os membros de Librezale escribiron máis de 2.000 frases a man e tamén as obtiveron de subtítulos de películas en dominio público como A vida é fermosa. A colección completouse con outras 3.900 frases extraídas dos textos expresamente cedidos por ARGIA para este proxecto. As gravacións feitas con estas frases son as que utilizaremos para adestrar o motor no recoñecemento da voz.
Esta noticia foi publicada por Iametza Interactive e trouxémola a ARGIA grazas ás licenzas libres Creative Commons.