Ir o contido principal

O galego mellorará a súa presenza no mundo dixital grazas aos 10.000 fragmentos de voz do Validatón

Participantes na fase presencial do Validatón 2025
Participantes na fase presencial do Validatón 2025
A actividade, na que participaron unha trintena de persoas, é un maratón de validación e gravación de fragmentos de voz en galego doados á plataforma pública Common Voice
Santiago de Compostela

O Validatón 2025 pechou a súa segunda edición cun balance de 10.000 fragmentos de audio revisados e gravados durante a fase en liña, que supoñen 13 horas de contribución aos datos de voz en galego en Common Voice: 6 de gravación e 7 de validación. Ademais, na fase presencial deste xoves en Filoloxía, os participantes crearon un total de 1.920 frases que se engadirán á plataforma para a súa lectura.

A actividade, organizada polo Instituto da Lingua Galega (ILG) e mais o Proxecto Nós, estaba dirixida a estudantes da Facultade de Filoloxía da USC e premiou a participación en tres categorías: Víctor Pose, en gravación de fragmentos de voz; Álex Rodríguez Guisantes, en validación de audios; e Lucía López Lires, en xeración de frases. Tamén foi recoñecida como campioa global Noa Sobrino Lamas por ser a persoa con máis contribucións totais. Todos eles recibiron premios en metálico grazas ao apoio de Atlantic Ponte e Imaxin Software. En total, unha trintena de persoas participaron nesta segunda edición do Validatón.

Para adestrar modelos de recoñecemento da fala cómpre utilizar grandes corpus de datos orais, pero a maioría, en especial os que usan as grandes compañías, son datos pechados e non están dispoñibles. Neste sentido, Common Voice, ao ser unha plataforma pública de datos de voz alimentada por persoas voluntarias de todo o mundo, axuda a que as tecnoloxías sexan accesibles para quen as queira desenvolver. As persoas contribúen a Common Voice doando a súa voz e tamén xulgando como válidas ou non as doazóns feitas por outras persoas. Xérase así ese corpus público que permitirá que no futuro distintas aplicacións informáticas poidan comprender as persoas que falen en galego.

Outras iniciativas
Alén do Validatón, os coordinadores do Proxecto Nós lembran que o público xeral tamén pode contribuír a mellorar a presenza do galego no mundo dixital doando a súa voz a través de AgasallaNós. Esta campaña pretende rexistrar diferentes variedades fonéticas do galego para que as aplicacións baseadas no recoñecemento da fala dean identificado toda a riqueza da nosa lingua. O obxectivo é recompilar gravacións que representen diferentes idades, xéneros e variedades dialectais. Toda a información pódese atopar na web doagalego.nos.gal.

Outra iniciativa, reservada ao alumnado de grao da Universidade de Santiago de Compostela, consiste na participación nunha actividade formativa de recollida e validación de datos de voz en galego certificada pola USC como formación a través do recoñecemento dun crédito ECTS.

Proxecto Nós
O Proxecto Nós é unha iniciativa para situar o galego xunto coas linguas máis desenvolvidas no ámbito da tecnoloxía da lingua e a Intelixencia Artificial. O seu obxectivo principal é xerar os recursos necesarios para facilitar o desenvolvemento de servizos e produtos baseados na tecnoloxía da lingua, como asistentes de voz, tradutores automáticos ou axentes conversacionais.

En paralelo, o proxecto promove tamén a presenza dixital do galego, facilitando a creación dunha ampla variedade de ferramentas e de recursos de alta calidade e de uso libre. Algunhas delas xa están á disposición e accesibles a través da web do proxecto para calquera persoa, institución, organización ou empresa que queira desenvolver un produto tecnolóxico, aplicación ou servizo que incorpore a lingua galega. Deste xeito, ademais de garantir os dereitos lingüísticos da comunidade galegofalante no mundo dixital, tamén se contribuirá á modernización e dixitalización do ecosistema de empresas galegas e á creación de valor con novos produtos que empreguen o galego.

O Proxecto Nós é unha iniciativa da Xunta de Galicia, que lle encomendou a súa execución á Universidade de Santiago de Compostela (USC) a través de dúas entidades punteiras de investigación en Intelixencia Artificial e Tecnoloxías da linguaxe: o ILG e o CiTIUS. Actualmente o proxecto está sendo financiado polo Ministerio para la Transformación Digital y de la Función Pública con fondos da Unión Europea-NextGenerationEU, no marco do proxecto ILENIA
 

Os contidos desta páxina actualizáronse o 11.04.2025.