Common Voice és una iniciativa de la Fundació Mozilla que té com a objectiu crear millors tecnologies de coneixement de la veu i que siguin accessibles per a tots. Cada vegada és més habitual utilitzar la veu per a interactuar amb les màquines, però fins ara els sistemes (Google Assistant, Apple Siri, Microsoft Cortana, Amazon Alexa...) tenen molts problemes:
Només poden utilitzar-se en les llengües més esteses. Les grans empreses que tenen darrere només miren als beneficis econòmics i les llengües petites no són viables per a ells. En cas que no sorgeixin alternatives, els bascos haurem de parlar en castellà a la televisió, als telèfons mòbils i a altres dispositius. El mateix els ocorrerà a centenars de milions de persones d'altres llengües minoritàries a tot el món.
Common Voice estarà disponible en el major nombre d'idiomes possible, potencialment en qualsevol idioma. 20 idiomes ja estan realitzant gravacions de veu i altres 70 més estan preparant per a això. La tecnologia ens permetrà parlar en la nostra llengua materna als bascos i a altres comunitats lingüístiques del món com la nostra.
No tenen en compte la diversitat de veus. Parlar un idioma principal no garanteix que el dispositiu entengui la teva veu. Si parles amb accent o ets dona tindràs més dificultats, ja que la majoria de les veus que s'han utilitzat històricament per a entrenar a aquests motors han estat d'homes blancs de classe mitjana.
Common Voic vol tenir en compte tot tipus de veus. Per això volem que el reconeixement de veu en basca sigui el més variat possible: dones i homes, de totes les edats, euskaldunberris i euskaldunzaharras, de tots els racons d'Euskal Herria...
Escolten constantment i envien al servidor les gravacions de les nostres veus. Són un malson des del punt de vista de la privacitat. “Per la nostra voluntat” són els espies que hem ficat a casa. A l'ésser un programari propietari, els usuaris no podem saber què es fa amb les nostres gravacions de veu en el dispositiu i no tenim cap control sobre el que ocorre en el servidor. Les grans empreses obtenen beneficis a través de la venda de dades privades de la ciutadania.
Common Voic donarà prioritat a la privacitat, no enviarà la nostra veu a cap lloc. El processament de veu es realitzarà en el propi dispositiu. La nostra veu no serà enviada, analitzada o monitorada. Els projectes de programari lliure demostren que la tecnologia pot sorgir d'una altra manera, posant com a objectiu les necessitats i els drets de la ciutadania.
Si vols saber més sobre Common Voice et recomanem que llegeixis la pàgina Preguntes freqüents del projecte.
Per a poder parlar en basc amb la tecnologia es necessiten unes 10.000 hores de veu per a entrenar el motor. Per a això, Librezal ha fet una crida a l'auzolan digital, on els treballadors podran participar. Si vols participar pots fer les gravacions a qualsevol hora i des de qualsevol lloc:
També pot ajudar a validar les gravacions que ja s'han realitzat. Per a això, premi "Escoltar" i segueixi les instruccions. És molt senzill i pots fer-ho des d'un ordinador o des del teu mòbil. Això sí, et recomanem que les gravis en un lloc silenciós perquè les gravacions siguin de bona qualitat.
Dins d'aquest auzolan digital hem organitzat una marató de gravació en col·laboració amb Librezale i Hirikilabs. Serà en Tabakalera (Donostia-Sant Sebastià) el 9 d'abril, de 18.00 a 20.00 hores. Anima't i participa!
Com a empresa que integra tecnologia, disseny i comunicació fomentem les tecnologies lliures i el basc és un valor per a nosaltres. Per això, ens esforcem en què el basc tingui també presència en les tecnologies avançades. Per tant, creiem necessari promoure aquest tipus de projectes participatius i lliures, perquè, com en aquest cas, en el futur puguem tenir a les nostres mans diferents productes per a comunicar-se en basc amb les màquines i que el basc no sigui un idioma de segona.
Ens sembla important fer passos en l'àmbit de la sobirania tecnològica i construir alternatives com a país davant les grans companyies. L'organització d'aquesta marató no és el primer pas que donem en aquest camí, per exemple, l'any passat Mastodon.eus col·laborem en la posada en marxa d'una xarxa social en basca alternativa a Twitter.
Abans de començar amb la fase de gravacions de veu, calia reunir 5.000 frases d'entre cinc i deu paraules. Les frases havien de tenir una llicència Creative Commons Zero (CC0), una cosa equivalent a estar en la propietat pública, la qual cosa afegia dificultat a l'obra. Els membres de Librezale van escriure més de 2.000 frases a mà i també les van obtenir de subtítols de pel·lícules en domini públic com La vida és bella. La col·lecció es va completar amb altres 3.900 frases extretes dels textos expressament cedits per ARGIA per a aquest projecte. Les gravacions fetes amb aquestes frases són les que utilitzarem per a entrenar el motor en el reconeixement de la veu.
Aquesta notícia ha estat publicada per Iametza Interactive i l'hem portat a ARGIA gràcies a les llicències lliures Creative Commons.