Ir o contido principal

Proxecto Nós contribúe á presenza da diversidade dialectal do galego no ecosistema dixital

Common Voice abre a porta á recollida dunha fala máis natural. Foto: Santi Alvite
Common Voice abre a porta á recollida dunha fala máis natural. Foto: Santi Alvite
O Instituto da Lingua Galega da USC colaborou coa redacción do primeiro conxunto de preguntas dispoñibles para a recollida de fala espontánea en galego en Common Voice
Santiago de Compostela

O galego e a súa diversidade dialectal dan un novo paso para garantir a súa presenza no ecosistema dixital do futuro, ademais de documentar e protexer a súa riqueza oral. A plataforma colaborativa Common Voice, alimentada por persoas voluntarias de todo o mundo, incorpora unha nova funcionalidade para o recoñecemento da fala, que permitirá rexistrar doazóns con acentos diversos, variantes léxicas e morfolóxicas, cambios de código ou fenómenos propios da oralidade que adoitan desaparecer na fala lida.

O Instituto da Lingua Galega (ILG) da Universidade de Santiago, a través do Proxecto Nós, colaborou coa redacción do primeiro conxunto de preguntas dispoñibles para a recollida de fala espontánea en galego. Porén, calquera persoa pode propoñer novas preguntas a través da plataforma, o que garante que os contidos evolucionen de forma aberta e participativa.

Ata agora, as contribucións nesa plataforma colaborativa consistían en gravacións de lectura en voz alta de textos dispoñibles en dominio público. A nova funcionalidade, que de momento está en fase de probas, abre a porta á recollida dunha fala máis natural, diversa e representativa do uso real da lingua no día a día, de xeito que a través de preguntas sinxelas rexistradas en Common Voice, as persoas voluntarias poderán gravar respostas breves e espontáneas que recollerán a súa variedade dialectal.

As achegas recollidas a través de Spontaneous Speech darán lugar a un conxunto de datos independente, que se publicará baixo licenza CC0. Isto permitirá que persoal investigador, lingüistas, etc. accedan a datos de fala espontánea en lingua galega de forma libre e gratuíta, fomentando deste xeito o desenvolvemento de tecnoloxías inclusivas e plurais, adaptadas ás necesidades reais das persoas usuarias, e a ciencia aberta ou cidadá, coa posibilidade para calquera persoa de participarmos na recolla de datos.

Doazón de voz con AgasallaNós

Baixo o lema AgasallaNós, e co obxectivo de facilitar a participación na recollida de voz en galego dentro desta plataforma, o Proxecto Nós ten dispoñible a páxina web doagalego.nos.gal, unha vía sinxela e accesible para contribuír ao proxecto. A través desta web, calquera persoa pode doar a súa voz, tanto lendo textos en voz alta como respondendo as novas preguntas de fala espontánea.

O obxectivo é recompilar gravacións que representen a diversidade do galego, co fin de contribuír ao desenvolvemento de tecnoloxías de recoñecemento da fala que identifiquen toda a riqueza da nosa lingua.

O Proxecto Nós é unha iniciativa para situar o galego canda as linguas máis desenvolvidas no ámbito da tecnoloxía da lingua e a Intelixencia Artificial. O seu obxectivo principal é xerar os recursos necesarios para facilitar o desenvolvemento de servizos e produtos baseados na tecnoloxía da lingua como asistentes de voz, tradutores automáticos ou axentes conversacionais.

En paralelo, o proxecto promove tamén a presenza dixital do galego, facilitando a creación dunha ampla variedade de ferramentas e de recursos de alta calidade e de uso libre. Algunhas delas (un tradutor neuronal multilingüe, un recoñecedor de voz que converte fala en texto escrito, e unha aplicación de síntese de voz que le en galego) xa están á disposición e accesibles a través da web do proxecto para calquera persoa, institución, organización ou empresa que queira desenvolver un produto tecnolóxico, aplicación ou servizo que incorpore a lingua galega. Deste xeito, ademais de garantir os dereitos lingüísticos da comunidade galegofalante no mundo dixital, tamén se contribuirá á modernización e dixitalización do ecosistema de empresas galegas e á creación de valor con novos produtos que empreguen o galego.

O Proxecto Nós é unha iniciativa da Xunta de Galicia, que lle encomendou a súa execución á USC a través de dúas entidades punteiras de investigación en Intelixencia Artificial e Tecnoloxías da linguaxe: o Instituto da Lingua Galega (ILG) e o Centro Singular de Investigación en Tecnoloxías Intelixentes (CiTIUS). Actualmente está sendo financiado polo Ministerio para la Transformación Digital y de la Función Pública con fondos da Unión Europea-NextGenerationEU, no marco do proxecto ILENIA.
 

Os contidos desta páxina actualizáronse o 21.07.2025.