Que fai Experto?
É un experto coñecedor de conversación. Toma arquivos de audio e vídeo e ofrece texto escrito. Tamén inclúe enlaces a vídeos e audios de Internet, é dicir, fai o mesmo con contidos de Youtube, Facebook e Instagram.
Mostra o texto escrito da transcrición como tal, os arquivos dos subtítulos listos e preparados e a transcrición coas marcas de tempo de cada palabra, é dicir, pódense realizar procuras nos vídeos, ademais de palabras, por marcas de tempo.
O salto da palabra á escritura é rápido, polo que o exercicio se pode realizar directamente. Pódese falar ao micrófono e ler nun instante o que escribiu.
En que situación atópase mellor?
É útil para moitos contidos audiovisuais. Pode servir para informativos, documentais, entrevistas. Nestes casos, o Experto crearía subtítulos. Tamén serve para transcribir as gravacións de audio das radios. Por exemplo, Elhuyar está a traballar con Antxetamedia. Ao ser a radio, Antxeta tamén ofrece entrevistas e reportaxes na súa web, onde se poderá seguir en directo. A intención é traer ao escrito algunhas destas gravacións de audio e tamén ofrecer aos lectores unha versión escrita.
Outro ámbito de aplicación é o das institucións públicas: reunións municipais, comparecencias parlamentarias e intervencións deste tipo pódense traer ao escrito. O texto pódese mostrar ao instante ou gardalo. Si fixámonos na relación comunicativa actual, combinando a linguaxe con outras tecnoloxías, xorden novas oportunidades. Poñamos un exemplo: a asemblea municipal está a seguirse por internet, os representantes municipais están a ver o texto escrito a medida que se está falando, e tamén se pode traducir ao castelán o texto que Elhuyar presentou recentemente itzultzailea.eus a través do tradutor neuronal. E si imos máis aló, ese texto que se recolle en castelán pódese converter en audio. Esta aplicación aínda non está desenvolvida, pero é factible.
É un servizo válido para persoas xordas e persoas con discapacidade física. Audiovisuais, calquera tipo de conferencia no salón de actos da localidade, asembleas municipais… todo iso é o que o xordo podería ver, xa que o discurso se convertería en texto. Quen non poida escribir, pode utilizar o sistema en sentido contrario, é dicir, a través dun micrófono de boa calidade recibiríase a súa fala e converteríase nunha conversación escrita.
Os que, sen ter discapacidade, non poden escribir en determinadas situacións, pero queren aproveitar a ocasión para falar están atentos a esta tecnoloxía. O responsable de Igor Leturia Adituren explícanos como alguén lle dixo que o usaría no coche. É dicir, para adiantar as contas de traballo, mentres conducen o coche, falarían ao móbil e este converteríao en texto. É dicir, en lugar de escribir o informe diante do computador, pódese aproveitar a viaxe de coche para contar o informe ao móbil de forma oral e nun instante terá o texto na man. Non realizaron ningunha proba real e non saben que resultado daría. De feito, a fala cognoscente necesita unha serie de condicións para realizar o seu traballo.
Cando non funciona ben?
Elhuyar colgou varios demo na web de Aditu para que cada un poida comprobar os resultados da conversación que coñece. O lehendakari da CAV asistiu a unha conferencia de fin de ano, a unha asemblea municipal, ao programa de televisión Teknopolis, á pequena dose audiovisual de Imanol Pagola e a un exercicio simultáneo. O resultado é moi ordenado, aínda que aínda hai erros. Peitear o texto. De todos os xeitos, neste tipo de gravacións de audio e vídeo consegue bos resultados, pero ten limitacións e non sempre obtén resultados dese demo.
O audio debe ter unha boa calidade, vese gravemente si non se utiliza un bo micrófono ou si hai eco ou si hai máis dunha persoa falando. Si o falante está de súpeto e deixa as palabras a medias, si se retrae, logo detense… hai problemas para recibir ben este tipo de conversacións. Un exemplo do xornalista que publicará a entrevista realizada na revista é válido. O resultado sería moi diferente si o xornalista entrevistase a unha soa persoa no salón de casa e cunha boa gravadora, ou si no canto dunha entrevistase a dous ou tres persoas e no bar onde se pon a música. Si quérese obter un bo resultado hai que fixarse na calidade do audio e tamén na forma de fala do falante. Está mellor preparado para o eúscaro batua e o dialecto non lles atrapa tan ben.
Que hai e en que queren mellorar?
De momento, Elhuyar abriu a páxina web de Aditu e calquera pode probar a linguaxe que coñece, cos seus propios erros. Existe a posibilidade de realizar probas gratuítas, así como un espazo para clientes. A partir de agora, realizaranse aplicacións concretas en función dos requirimentos dos clientes. De face ao futuro, Leturia cre que a combinación da tradución automática e a creación de fala abre as portas a varias opcións e vanas a desenvolver. Un deles sería o exemplo que mencionamos anteriormente, é dicir, pasar á linguaxe escrita, converter ese texto en castelán e o texto en audio. Si aplicásese toda esta tecnoloxía nun discurso en directo, falaríase de tradución simultánea: o orador en eúscaro, e grazas á tecnoloxía, sen necesidade de tradutor ou intérprete profesional, os oíntes poderían seguir a conferencia en castelán.
Cando traballas con persoas maiores ou con persoas con diversidade física e neuronal, dásche conta de que a idea da competencia na nosa sociedade limítanos moito como especie. É dicir, o noso sistema ponche en valor por facer as cousas de maneira específica, e o que non o... [+]
A presenza de Elon Musk nos medios de comunicación avanza como un foguete tras aterrar no xardín da Casa Branca. Outros poderes, ao parecer, víronse alterados polo poder e a influencia que está a adquirir, e para reducir a súa influencia, cargaron contra a rede X. Nas... [+]
En Internet aparece o título dunha película que aínda vin de pequena cando buscaba a palabra Willow. Nesta película chea de fantasía, o protagonista, un pequeno home chamado Willow, transformou o mundo liberando aos seus habitantes dun reino opresor. Google acaba de lanzar... [+]
Quizá unha das debilidades dos seres humanos é a tendencia que temos de escoitar e atender á maioría. Seguro que foi unha característica importante do desenvolvemento da nosa especie e necesaria para a supervivencia. Pero coa dixitalización, esa característica que temos... [+]
A evolución que tomou Internet nos últimos 15 anos, unido ao seu modelo tecnolóxico e de negocio, fainos pensar que é unha ferramenta para incrementar os peores aspectos da humanidade. En todo o mundo creáronse axentes que non están satisfeitos con esta idea. Traballan... [+]