Créditos ECTS Créditos ECTS: 6
Horas ECTS Criterios/Memorias Traballo do Alumno/a ECTS: 99 Horas de Titorías: 3 Clase Expositiva: 24 Clase Interactiva: 24 Total: 150
Linguas de uso Castelán, Galego
Tipo: Materia Ordinaria Grao RD 1393/2007 - 822/2021
Departamentos: Lingua e Literatura Españolas, Teoría da Literatura e Lingüística Xeral
Áreas: Lingüística Xeral
Centro Facultade de Filoloxía
Convocatoria: Segundo semestre
Docencia: Con docencia
Matrícula: Matriculable
• Desenvolver destrezas para abordar os múltiples problemas que presentan as linguas naturais para o seu tratamento computacional nos seus diferentes niveis, atendendo de xeito integrado ás perspectivas lingüística, lóxica, matemática e informática.
• Coñecer os diferentes modelos de procesamento computacional das linguas naturais.
• Achegarse aos métodos e ferramentas de traballo empírico da Lingüística actual que permitan ao estudante manexar datos lingüísticos reais procedentes de diversos corpus para o seu posterior tratamento informático e computacional.
• Coñecer os recursos relacionados co tratamento computacional da linguaxe (bases de datos, ferramentas de análise textual, programas de tradución automática, sistemas de ditado automático, etc.).
• Analizar estes recursos e os resultados obtidos a partir do seu manexo e aplicación co fin de poder valoralos criticamente de acordo cos coñecementos teóricos e metodolóxicos adquiridos.
TEMA 1. Lingüística Computacional: evolución historiográfica e principais liñas de investigación.
1. Introdución ao campo da Lingüística Computacional
1.1. Lingüística e Informática; Lingüística e Intelixencia artificial.
1.2. A Lingüística Computacional no seo da Lingüística aplicada: caracterización e historiografía.
2. O carácter transdisciplinar da Lingüística Computacional: vertentes de estudo
2.1. Lingüística informática: ferramentas de manipulación e análise de datos, dicionarios automáticos, deseño e explotación de corpus lingüísticos.
2.2. Procesamento das linguas naturais e tradución automática.
2.3. Tecnoloxías (do texto e da fala) e Industrias da lingua.
TEMA 2. Utilidades informáticas en Lingüística e desenvolvementos da Lingüística de Corpus como metodoloxía de base empírica.
1. Introdución
1.1. Ubicación do campo da Lingüística informática dentro dos estudos en Lingüística computacional.
1.2. Panorámica das utilidades informáticas en Lingüística.
2. Transcrición de interaccións comunicativas (o sistema CHILDES)
2.1. Linguaxe adulta (de interese para Pragmática, Análise do discurso, Dialectoloxía, Sociolingüística, Ensino_Aprendizaxe de linguas, Planificación lingüística).
2.2. Linguaxe infantil (de interese para Psicolingüística evolutiva, Lingüística clínica, Ensino_Aprendizaxe de linguas, Planificación lingüística).
3. Ferramentas de manipulación e análise de datos
3.1. Índices e frecuencias.
3.2. Concordancias e colocacións.
4. Desenvolvementos da Lingüística de Corpus como metodoloxía de base empírica:
4.1. Recursos, ferramentas e aplicacións en Lingüística computacional.
4.2. Tipos e utilidade dos corpus.
4.3. Procesos de enriquecimento e extracción de información dun corpus: segmentación, análise, tipificación, etiquetado.
5. Lexicografía computacional:
5.1. Bancos de datos lexicográficos.
5.2. Dicionarios electrónicos.
TEMA 3. Procesamento das linguas naturais e Tradución automática.
1. Introdución
1.1. O tratamento computacional das linguas: do natural ao automático.
2. Procesamento das linguas naturais (vertentes oral e escrita)
2.1. Introdución ao procesamento das linguas naturais. Os procesos de recoñecemento e síntese. Os sistemas de diálogo.
2.2. Procesamento das linguas naturais (vertente escrita): as tecnoloxías do texto.
2.3. Procesamento das linguas naturais (vertente oral): as tecnoloxías da fala.
2.4. Modelos vectoriais
2.5. Aplicacións do procesamento das linguas naturais: presente e futuro.
3. A tradución automática
3.1. Historiografía do ámbito da tradución automática.
3.2. Tradución automática fronte a tradución asistida por ordenador.
3.3. Clasificación dos sistemas de tradución automática: criterios e tipoloxía.
3.4. A tradución automática en liña.
TEMA 4. Tratamento da lingua –falada e escrita– e desenvolvemento de produtos comerciais: lingüística e tecnoloxía.
1. Introdución
1.1. Situación do campo das Tecnoloxías e Industrias lingüísticas no seo da Lingüística Computacional. Relación destas dúas vertentes cos eidos da Tecnoloxía de comunicacións e da Enxeñaría lingüística.
1.2. Panorámica actualizada das vertentes de aplicación en Tecnoloxías da fala e Industrias da lingua.
2. Tecnoloxías da fala
2.1. Introdución.
2.2. Aplicacións: Síntese da fala, Recoñecemento da fala. Tradución oral automática. Identificación e/ou verificación da identidade dos interlocutores.
2.4. Sistemas de diálogo persoa-máquina.
3. Industrias da lingua
3.1. Introdución.
3.2. Aplicacións: Conversión de texto a fala; ditado automático; recuperación, procura e extracción de información; produción asistida por ordenador (PAO) e edición electrónica, e produtos multimedia; tradución automática e asistida; correctores (ortográficos, gramaticais e estilísticos) e verificadores; tesauros e dicionarios electrónicos; tratamento multilingüe de textos; E_ALAO (Ensino_Aprendizaxe de Linguas Asistido por Ordenador); aplicacións da Enxeñaría lingüística á axuda a persoas con diversidade funcional (tratamento da escritura, lectura óptica, Sistemas Aumentativos y Alternativos de Comunicación_SAAC), Tecnoloxía e xestión do multilingüismo.
BIBLIOGRAFÍA BÁSICA (DE LECTURA RECOMENDADA)
LLISTERRI, J. (2007), "El español y las nuevas tecnologías", en M. Lacorte (ed.) Lingüística aplicada del español. Madrid: Arco/Libros (Biblioteca Philologica), 483-520.
LLISTERRI, J. et alii (2003), “El papel de la lingüística en el desarrollo de las tecnologías del habla”, en M. Casas (dir.) e C. Varo (ed.), VII Jornadas de Lingüística, Cádiz: Servicio de Publicaciones Universidad de Cádiz, 137-191.
MARTÍ, M.ª A. (coord.) (2003), Tecnologías del Lenguaje, Barcelona: UOC.
MORENO FERNÁNDEZ, F. (1990), “Lingüística informática e informática lingüística”, Lingüística Española Actual, 12/1, 5-16.
MORENO SANDOVAL, A. (1998), Lingüística computacional, Madrid: Síntesis. (pp. selecc.)
MOURE, T. e J. LLISTERRI (1996), “Lenguaje y nuevas tecnologías. El campo de la lingüística computacional”, en M. Fernández Pérez (coord.), Avances en Lingüística Aplicada, Santiago: USC, 147-227.
PARODI, G. (2008), “Lingüística de Corpus: una introducción al ámbito”, Revista de Lingüística Teórica y Aplicada, 46/1, 93-119.
PERIÑÁN, C. (2005) “Procesamiento del lenguaje natural: de lingüista a ingeniero del conocimiento”, en I. K. Brady, M. Navarro e C. Periñán (eds.), Nuevas Tendencias en Lingüística Aplicada, Murcia: Quaderna, 293-317.
ROJO, G. (2005-2006), “Informática y Lingüística: Las lenguas en la sociedad del conocimiento”, Boletín de RedIRIS, 74-75. [http://www.rediris.es/rediris/boletin/74-75/ponencia1.pdf]
RUIZ, J. C. (2005), “Lenguaje e informática/Lenguaje y ordenadores”, en Á. López e B. Gallardo (eds.), Conocimiento y lenguaje, València: Universitat, 401-436.
SÁNCHEZ RAMOS, M.ª del Mar e Celia Rico Pérez (2020): Traducción automática: conceptos clave, procesos de evaluación y técnicas de posedición, Granada: Comares.
TORDERA YLLESCAS, J.C. (2011). "Sobre la Lingüística Computacional: Fundamentos". In Lingüística Computacional. Tecnologías del Habla. Anejo n.º 74 Revista QUADERNS DE FILOLOGIA
TORRIJOS, Carmen (2020). “Lingüística computacional y tecnologías del lenguaje." Revista de privacidad y derecho digital, 5(19) pp. 25-64.
TORRUELLA, J. e J. LLISTERRI (1999), "Diseño de corpus textuales y orales", en J.M. Blecua et alii (eds.) Filología e informática (...). Barcelona: UAB / Milenio, 45-77.
TORRUELLA, J. (2017), Lingüística de corpus: génesis y bases metodológicas de los corpus (históricos) para la investigación en Lingüística, Frankfurt am Main: Peter Lang.
BIBLIOGRAFÍA COMPLEMENTARIA
ADOLPHS, S. (2006): Introducing Electronic Text Analysis. A practical guide for language and literary studies, London/New York: Routledge.
AERES, F. (2008), El robot enamorado. Una historia de la Inteligencia Artificial, Barcelona: Ariel.
BARONI, M. (2008). "Distributions in text.". In Corpus Linguistics: An International Handbook, Volume 2, article 39: 803-822. Mouton de Gruyter, Berlin. [https://home.sslmit.unibo.it/~baroni/publications/hsk_39_dist_rev2.pdf]
BOLEDA, G. (2020). "Distributional Semantics and Linguistic Theory." Annual Review of Linguistics 6:213-34. [https://arxiv.org/abs/1905.01896]
CANTOS, P. e A. Sánchez (eds.) (2009), A Survey of Corpus-based Research. Panorama de investigaciones basadas en corpus, AELINCO: Murcia.
ERK, K. (2012). "Vector space models of word meaning and phrase meaning: A survey." Language and Linguistics Compass 6.10: 635-653.
Rocha, Marcos (2016)."Uma história da linguística computacional no âmbito das ciências cognitivas". Circumscribere:Int. J.for the History of Science,18
Ademais das competencias xerais propias dos estudos universitarios e especificadas nos títulos de Grao, os estudantes desta materia deberan acadar as seguintes competencias específicas:
4.1.1.Competencias disciplinares cognitivas (saber)
(1) Capacidade de reflexión crítica sobre as relacións entre as linguas e as novas tecnoloxías.
(2) Adquisición das bases teórico-metodolóxicas da Lingüística Computacional.
(3) Coñecemento das ferramentas, aplicacións e recursos de natureza diversa desenvolvidas por e para o estudo computacional das linguas.
(4) Comprensión, avaliación e aproveitamento destas ferramentas e recursos.
4.1.2. Competencias profesionais procedimentais (saber facer)
(1) Manexo eficaz dos recursos técnicos sobre linguas e comunicación –incluídos os accesibles en liña– en particular os orientados á investigación e á formación en ámbitos lingüísticos, literarios, de creación ou de investigación filolóxica.
(2) Capacidade para poñer en práctica algúns dos coñecementos adquiridos en ámbitos como: tradución automática, confección e explotación de corpora lingüísticos, e recoñecemento e síntese de fala.
4.1.3. Competencias académicas actitudinais (ser)
(1) Capacidade para poñer en relación as distintas disciplinas nas que se sustenta o estudo computacional das linguas.
(2) Interese pola diversidade lingüística e cultural e sensibilidade na valoración das súas repercusións no manexo e deseño de ferramentas computacionais para o estudo dos fenómenos comunicativos.
(3) Capacidade para analizar, valorar e promover as aplicacións técnicas de comunicación multimodal naqueles casos de trastornos comunicativos derivados de lesións motoras e/ou sensoriais.
(4) Desenvolvemento dunha actitude crítica perante o manexo e xestión das TIC e da Internet nos ámbitos académico, investigador e profesional.
A materia adoptará unha metodoloxía de ensino presencial que garanta a interacción entre profesorado e estudantado sen que isto supoña minusvalorar o proceso de aprendizaze autónoma. Así, o curso de Lingüística Computacional desenvolverase a través das clases presenciais (3 h. semanais) e do traballo persoal dos estudantes en horas non presenciais (estudo do temario a través das lecturas básicas e preparación dos exercicios de aplicación).
As clases presenciais serán de tres tipos:
1. Sesións expositivas (1 hora/semana): o profesorado proporcionará a información teórica básica dos temas do programa, reforzada coa presentación de diversos materiais representativos dos conceptos estudados. Máis concretamente, asignamos a cada tema desta materia unha serie de lecturas específicas recomendadas que presentan con claridade os contidos teórico-prácticos sobre o procesamento lingüístico e as súas aplicacións informáticas.
2. Sesións seminario ou interactivas (2 horas/semana): Nas sesións de seminario proporanse exercicios prácticos, acompañados de explicacións detalladas, para traballar cos conceptos teóricos máis relevantes.
3. Titorías programadas (1 hora e media) co obxectivo de guiar o traballo autónomo dos estudantes.
Como complemento das sesións expositivas e interactivas, habilitarase unha aula virtual que se utilizará para o depósito dos materiais dixitais que o profesorado vaia preparando ao longo do curso e para difundir calquera tipo de información de interese xeral.
Os exercicios de aplicación que os estudantes elaborarán nas horas non presenciais responderán aos seguintes tipos:
a) Resposta a cuestións breves relacionadas cos contidos dos temas, que obriguen a enfrontarse aos aspectos de máis difícil comprensión para aclarar as posibles dúbidas ou que sirvan de aplicación práctica de conceptos explicados nas sesións de clase.
b) Revisión crítica de distintas fontes documentais relacionadas cos contidos da materia.
En liñas xerais, os estudantes deberán ser quen de demostrar a asimilación dos contidos e o dominio das destrezas que contribúan ao desenvolvemento de competencias profesionais a través da redacción e presentación oral de tarefas que non só estimulen a reflexión crítica sobre o material estudado, senón que ademais esixan a toma de decisións motivadas, anticipen problemas potenciais e propoñan posibles solucións desde a perspectiva dun/ha investigador/a en Lingüística Computacional.
i) ESTUDANTES QUE ASISTEN REGULARMENTE:
* 1ª OPORTUNIDADE:
Ao comezo do cuadrimestre, cada estudante poderá escoller entre estas dúas opcións de avaliación:
(a) Proba final de toda a materia, que incluirá cuestións de natureza teórica e práctica sobre a base dos contidos presentados nas sesións expositivas e interactivas así como das lecturas básicas. Esta proba realizarase na aula de informática na data establecida pola Secretaría da Facultade (26/05/2025).
(b) Avaliación continuada (atendendo á distribución da carga ECTS):
• un 70% da cualificación corresponderá ao traballo desenvolvido nas sesións interactivas
• un 30% da cualificación corresponderá ao traballo desenvolvido nas sesións expositivas
Os aspectos, criterios e instrumentos da avaliación continuada aparecen recollidos no seguinte esquema:
ASPECTOS
- Conceptos, métodos e ferramentas aprendidos durante todo o curso
- Asistencia, participación e aproveitamento das sesións
CRITERIOS
- Dominio dos coñecementos teóricos e operativos da materia
- Aproveitamento das lecturas
- Participación activa nas sesións
- Calidade científica dos traballos: asimilación de contidos, comprensión dos textos, análises e interpretacións adecuadas
INSTRUMENTOS
- Traballos (entregados por escrito e/ou expostos de xeito oral)
- Probas de avaliación de contidos
* 2ª OPORTUNIDADE:
Cada estudante poderá escoller entre estas dúas opcións de avaliación:
(a) Proba final de toda a materia, que incluirá cuestións de natureza teórica e práctica sobre a base dos contidos presentados nas sesións expositivas e interactivas así como das lecturas básicas. Esta proba realizarase na aula de informática na data establecida pola Secretaría da Facultade (01/07/2025).
(b) Presentación -ata o 01/07/2025- dunha nova versión daqueles traballos de curso que non tivesen acadado o nivel suficiente ou, de ser o caso, proporíanse unha serie de actividades substitutivas que se anunciarían no momento de facer públicas as cualificacións da 1.ª oportunidade.
ii) ESTUDANTES CON DISPENSA DE ASISTENCIA A CLASE
Aquelas persoas que teñan concedida polo Decanato a dispensa de asistencia a clase e, polo tanto, non poidan seguir a avaliación continuada, serán avaliadas exclusivamente a través dunha proba final de toda a materia que poderán realizar tanto na 1.ª (26/05/2025) como na 2.ª oportunidade (01/07/2025). Esta proba incluirá cuestións de natureza teórica e práctica sobre a base dos contidos presentados nas sesións expositivas e interactivas así como das lecturas básicas.
iii) INDICACIÓN XERAL PARA TODO O ESTUDANTADO: para os casos de realización fraudulenta de exercicios ou probas será de aplicación o recollido na 'Normativa de avaliación do rendemento académico dos estudantes e de revisión de cualificacións'
https://www.xunta.gal/dog/Publicados/2011/20110721/AnuncioG2018-190711-…
Tendo en conta o calendario oficial aprobado pola USC, a distribución temporal da materia ao longo do cuadrimestre queda como segue:
DISTRIBUCIÓN DA CARGA ECTS
SESIÓNS EXPOSITIVAS: 14 (horas presenciais) + 66 (horas non presenciais) = Total 80 horas
SESIÓNS SEMINARIO: 28 (horas presenciais) + 36 (horas non presenciais) = Total 64 horas
SESIÓNS TITORÍA GRUPO: 3 (horas presenciais) + 3 (horas non presenciais) = Total 6 horas
TOTAL: 45 (horas presenciais) + 105 (horas non presenciais) = Total 150 horas
Non se requiren coñecementos previos, máis aló da formación básica adquirida ata este momento nas materias de contido lingüístico cursadas nos diferentes Graos; a materia está planificada para que poida ser cursada por calquera estudante da Facultade.
Recoméndase que o estudantado posúa habilidades para a lectura (con capacidade de síntese) e comprensión crítica da información recollida en diferentes soportes.
Tamén convén posuír un nivel medio-alto de comprensión escrita das linguas española, galega e inglesa, xa que os materiais de consulta recomendados así como os empregados nas sesións de clase inclúen textos publicados nestes idiomas.
Por outra banda, debe terse moi en conta que para superar a materia, ademais de acadar o nivel requirido en canto a contidos e prácticas, será requisito indispensable amosar na realización das diferentes probas –orais e/ou escritas– un nivel de dominio (exposición e argumentación, redacción e ortografía) conforme coa situación académica.
(1) ATENCIÓN A ESTUDANTES (HORARIO, LUGAR E INFORMACIÓN DE CONTACTO)
* Horario: será fixado ao comezo do 2.º cuadrimestre (aparecerá na secretaría virtual e estará visible na porta do gabinete de cada docente)
* Contacto:
- Prof. Marcos Garcia González: Filoloxía_gab. 129 | +34 881 811 769 || marcos.garcia.gonzalez [at] usc.gal (marcos[dot]garcia[dot]gonzalez[at]usc[dot]gal)
- Prof. Marcos Garcia González: CiTIUS_gab: 106 | +34 881 816 427
- Prof. Pablo Gamallo Otero: Filoloxía_gab. 126 | +34 881 811 772 || pablo.gamallo [at] usc.gal (pablo[dot]gamallo[at]usc[dot]gal)
- Prof. Pablo Gamallo Otero: CiTIUS_gab: 106 | +34 881 816 426
* Lingua vehicular de docencia: GALEGO
Marcos Garcia Gonzalez
Coordinador/a- Departamento
- Lingua e Literatura Españolas, Teoría da Literatura e Lingüística Xeral
- Área
- Lingüística Xeral
- Correo electrónico
- marcos.garcia.gonzalez [at] usc.gal
- Categoría
- Investigador/a: Ramón y Cajal
Pablo Gamallo Otero
- Departamento
- Lingua e Literatura Españolas, Teoría da Literatura e Lingüística Xeral
- Área
- Lingüística Xeral
- Teléfono
- 881816426
- Correo electrónico
- pablo.gamallo [at] usc.gal
- Categoría
- Profesor/a: Catedrático/a de Universidade
Martes | |||
---|---|---|---|
11:00-12:00 | Grupo /CLIL_01 | Galego | D02-Aula de informática de docencia |
12:00-13:00 | Grupo /CLIL_01 | Galego | D02-Aula de informática de docencia |
26.05.2025 09:30-13:30 | Grupo /CLE_01 | D09 |
26.05.2025 09:30-13:30 | Grupo /CLIL_01 | D09 |
01.07.2025 09:30-13:30 | Grupo /CLE_01 | D03 |
01.07.2025 09:30-13:30 | Grupo /CLIL_01 | D03 |