Ir o contido principal

Nova edición do Validatón, unha iniciativa para mellorar a presenza do galego no mundo dixital

A actividade está dirixida a estudantes da Facultade de Filoloxía. Foto: Santi Alvite
A actividade está dirixida a estudantes da Facultade de Filoloxía. Foto: Santi Alvite
Consta dunha fase en liña xa activa e doutra presencial que terá lugar no Instituto da Lingua Galega na tarde deste xoves 10
Santiago de Compostela

Xa está en marcha o Validatón 2025, un maratón de validación de fragmentos de voz en galego para contribuír á creación de recursos para a nosa lingua en Common Voice, unha plataforma pública de datos de voz. A actividade, organizada polo Instituto da Lingua Galega (ILG) e mais o Proxecto Nós, está dirixida a estudantes da Facultade de Filoloxía da USC.

O Validatón consta de dúas fases. Na primeira, que ten modalidade en liña, pódese participar dende calquera lugar realizando contribucións en Common Voice ata as 12.00 horas do 10 de abril. A segunda fase consiste nunha sesión presencial no ILG este xoves 10 en horario de 16.00 a 20.00 horas.

A participación no Validatón é posible en tres categorías: gravación de fragmentos de voz, validación de audios e xeración de frases. Ao rematar a sesión presencial no ILG, a persoa con máis contribucións totais e mais as gañadoras de cada categoría recibirán premios en metálico posibles grazas ao apoio de Atlantic Ponte e Imaxin Software.

Éxito da primeira edición
A organización do Validatón aspira a mellorar as boas cifras da sesión presencial da primeira edición, na que se revisaron un total de 23.314 fragmentos de voz en lingua galega en Common Voice. Isto supuxo un 64% de todos os fragmentos validados nesa xornada na plataforma nas 120 linguas daquela en produción, que agora na actualidade ascenden xa a 130.

Para adestrar modelos de recoñecemento da fala cómpre utilizar grandes corpus de datos orais, pero a maioría, en especial os que usan as grandes compañías, son datos pechados e non están dispoñibles. Neste sentido, Common Voice, ao ser unha plataforma pública de datos de voz alimentada por persoas voluntarias de todo o mundo, axuda a que as tecnoloxías sexan accesibles para quen as queira desenvolver.

As persoas contribúen a Common Voice doando a súa voz e tamén xulgando como válidas ou non as doazóns feitas por outras persoas. Xérase así ese corpus público que permitirá que no futuro distintas aplicacións informáticas poidan comprender as persoas que falen en galego.

Outra iniciativa
Alén do Validatón, os coordinadores do Proxecto Nós lembran que o alumnado de grao da Universidade de Santiago de Compostela tamén pode contribuír a mellorar a presenza do galego no mundo dixital participando nunha actividade formativa de recollida e validación de datos de voz en galego certificada pola USC como formación a través do recoñecemento dun crédito ECTS.
 

Os contidos desta páxina actualizáronse o 08.04.2025.