Créditos ECTS Créditos ECTS: 6
Horas ECTS Criterios/Memorias Trabajo del Alumno/a ECTS: 99 Horas de Tutorías: 3 Clase Expositiva: 24 Clase Interactiva: 24 Total: 150
Lenguas de uso Castellano, Gallego
Tipo: Materia Ordinaria Grado RD 1393/2007 - 822/2021
Departamentos: Lengua y Literatura Españolas, Teoría de la Literatura y Lingüística General
Áreas: Lingüística General
Centro Facultad de Filología
Convocatoria: Segundo semestre
Docencia: Con docencia
Matrícula: Matriculable
• Desarrollar destrezas para abordar los múltiples problemas que presentan las lenguas naturales para su tratamiento computacional en sus diferentes niveles, atendiendo de modo integrado a las perspectivas lingüística, lógica, matemática e informática.
• Conocer los diferentes modelos de procesamiento computacional de las lenguas naturales.
• Acercarse a los métodos y herramientas de trabajo empírico de la Lingüística actual que permitan al estudiante manejar datos lingüísticos reales procedentes de diversos corpus para su posterior tratamiento informático y computacional.
• Conocer los recursos relacionados con el tratamiento computacional del lenguaje (bases de datos, herramientas de análisis textual, programas de traducción automática, sistemas de dictado automático, etc.).
• Analizar estos recursos y los resultados obtenidos a partir de su manejo y aplicación con el fin de poder valorarlos críticamente de acuerdo con los conocimientos teóricos y metodológicos adquiridos.
TEMA 1. Lingüística Computacional: evolución historiográfica y principales líneas de investigación.
1. Introducción al campo de la Lingüística Computacional.
1.1. Lingüística e Informática; Lingüística e Inteligencia artificial.
1.2. La Lingüística Computacional en el seno de la Lingüística aplicada: caracterización e historiografía.
2. El carácter transdisciplinar de la Lingüística Computacional: vertientes de estudio.
2.1. Lingüística informática: herramientas de manipulación y análisis de datos, diccionarios automáticos, diseño y explotación de corpus lingüísticos.
2.2. Procesamiento de las lenguas naturales y traducción automática.
2.3. Tecnologías (del texto y del habla) e Industrias de la lengua.
TEMA 2. Utilidades informáticas en Lingüística y desarrollos de la Lingüística de corpus como metodología de base empírica.
1. Introducción
1.1. Ubicación del campo de la Lingüística informática dentro de los estudios en Lingüística computacional.
1.2. Panorámica de las utilidades informáticas en Lingüística.
2. Transcripción de interacciones comunicativas (el sistema CHILDES)
2.1. Lenguaje adulto (de interés para Pragmática, Análisis del discurso, Dialectología, Sociolingüística, Enseñanza_Aprendizaje de lenguas, Planificación lingüística).
2.2. Lenguaje infantil (de interés para Psicolingüística evolutiva, Lingüística clínica, Enseñanza/Aprendizaje de lenguas, Planificación lingüística).
3. Herramientas de manipulación y análisis de datos
3.1. Índices y frecuencias.
3.2. Concordancias y colocaciones.
4. Desarrollos de la Lingüística de Corpus como metodología de base empírica:
4.1. Recursos, herramientas y aplicaciones en Lingüística computacional.
4.2. Tipos y utilidad de los corpus.
4.3. Procesos de enriquecimiento y extracción de información de un corpus: segmentación, análisis, tipificación, etiquetado.
5. Lexicografía computacional:
5.1. Bancos de datos lexicográficos.
5.2. Diccionarios electrónicos.
TEMA 3. Procesamiento de las lenguas naturales y Traducción automática.
1. Introducción
1.1. El tratamiento computacional de las lenguas: de lo natural a lo automático.
2. Procesamiento de las lenguas naturales (vertientes oral y escrita).
2.1. Introducción al procesamiento de las lenguas naturales. Los procesos de reconocimiento y síntesis. Los sistemas de diálogo.
2.2. Procesamiento de las lenguas naturales (vertiente escrita): las tecnologías del texto.
2.3. Procesamiento de las lenguas naturales (vertiente oral): las tecnologías del habla.
2.4. Modelos vectoriales
2.5. Aplicaciones del procesamiento de las lenguas naturales: presente y futuro.
3. La traducción automática
3.1. Historiografía del ámbito de la traducción automática.
3.2. Traducción automática frente a traducción asistida por ordenador.
3.3. Clasificación de los sistemas de traducción automática: criterios y tipología.
3.4. La traducción automática en línea.
TEMA 4. Tratamiento de la lengua –hablada y escrita– y desarrollo de productos comerciales: lingüística y tecnología.
1. Introducción
1.1. Situación del campo de las Tecnologías e Industrias lingüísticas en el seno de la Lingüística Computacional. Relación de estas dos vertientes con los campos de la Tecnología de comunicaciones y de la Ingeniería lingüística.
1.2. Panorámica actualizada de las vertientes de aplicación en Tecnologías del habla e Industrias de la lengua.
2. Tecnologías del habla
2.1. Introducción.
2.2. Aplicaciones: Síntesis del habla. Reconocimiento del habla. Traducción oral automática. Identificación y/o verificación de la identidad de los interlocutores.
2.4. Sistemas de diálogo persona-máquina.
3. Industrias de la lengua
3.1. Introducción.
3.2. Aplicaciones: Conversión de texto a habla; dictado automático; recuperación, búsqueda y extracción de información; producción asistida por ordenador (PAO) y edición electrónica, y productos multimedia; traducción automática y asistida; correctores (ortográficos, gramaticales y estilísticos) y verificadores; tesauros y diccionarios electrónicos; tratamiento multilingüe de textos; E_ALAO (Enseñanza_Aprendizaje de Lenguas Asistida por Ordenador); aplicaciones de la Ingeniería lingüística a la ayuda a personas con diversidad funcional (tratamiento de la escritura, lectura óptica, Sistemas Aumentativos y Alternativos de Comunicación_SAAC), Tecnología y gestión del multilingüismo.
BIBLIOGRAFÍA BÁSICA (DE LECTURA RECOMENDADA)
LLISTERRI, J. (2007), "El español y las nuevas tecnologías", en M. Lacorte (ed.) Lingüística aplicada del español. Madrid: Arco/Libros (Biblioteca Philologica), 483-520.
LLISTERRI, J. et alii (2003), “El papel de la lingüística en el desarrollo de las tecnologías del habla”, en M. Casas (dir.) e C. Varo (ed.), VII Jornadas de Lingüística, Cádiz: Servicio de Publicaciones Universidad de Cádiz, 137-191.
MARTÍ, M.ª A. (coord.) (2003), Tecnologías del Lenguaje, Barcelona: UOC.
MORENO FERNÁNDEZ, F. (1990), “Lingüística informática e informática lingüística”, Lingüística Española Actual, 12/1, 5-16.
MORENO SANDOVAL, A. (1998), Lingüística computacional, Madrid: Síntesis. (pp. selecc.)
MOURE, T. e J. LLISTERRI (1996), “Lenguaje y nuevas tecnologías. El campo de la lingüística computacional”, en M. Fernández Pérez (coord.), Avances en Lingüística Aplicada, Santiago: USC, 147-227.
PARODI, G. (2008), “Lingüística de Corpus: una introducción al ámbito”, Revista de Lingüística Teórica y Aplicada, 46/1, 93-119.
PERIÑÁN, C. (2005) “Procesamiento del lenguaje natural: de lingüista a ingeniero del conocimiento”, en I. K. Brady, M. Navarro e C. Periñán (eds.), Nuevas Tendencias en Lingüística Aplicada, Murcia: Quaderna, 293-317.
ROJO, G. (2005-2006), “Informática y Lingüística: Las lenguas en la sociedad del conocimiento”, Boletín de RedIRIS, 74-75. [http://www.rediris.es/rediris/boletin/74-75/ponencia1.pdf]
RUIZ, J. C. (2005), “Lenguaje e informática/Lenguaje y ordenadores”, en Á. López e B. Gallardo (eds.), Conocimiento y lenguaje, València: Universitat, 401-436.
SÁNCHEZ RAMOS, M.ª del Mar e Celia Rico Pérez (2020): Traducción automática: conceptos clave, procesos de evaluación y técnicas de posedición, Granada: Comares.
TORDERA YLLESCAS, J.C. (2011). "Sobre la Lingüística Computacional: Fundamentos". In Lingüística Computacional. Tecnologías del Habla. Anejo n.º 74 Revista QUADERNS DE FILOLOGIA
TORRIJOS, Carmen (2020). “Lingüística computacional y tecnologías del lenguaje." Revista de privacidad y derecho digital, 5(19) pp. 25-64.
TORRUELLA, J. e J. LLISTERRI (1999), "Diseño de corpus textuales y orales", en J.M. Blecua et alii (eds.) Filología e informática (...). Barcelona: UAB / Milenio, 45-77.
TORRUELLA, J. (2017), Lingüística de corpus: génesis y bases metodológicas de los corpus (históricos) para la investigación en Lingüística, Frankfurt am Main: Peter Lang.
BIBLIOGRAFÍA COMPLEMENTARIA
ADOLPHS, S. (2006): Introducing Electronic Text Analysis. A practical guide for language and literary studies, London/New York: Routledge.
AERES, F. (2008), El robot enamorado. Una historia de la Inteligencia Artificial, Barcelona: Ariel.
BARONI, M. (2008). "Distributions in text.". In Corpus Linguistics: An International Handbook, Volume 2, article 39: 803-822. Mouton de Gruyter, Berlin. [https://home.sslmit.unibo.it/~baroni/publications/hsk_39_dist_rev2.pdf]
BOLEDA, G. (2020). "Distributional Semantics and Linguistic Theory." Annual Review of Linguistics 6:213-34. [https://arxiv.org/abs/1905.01896]
CANTOS, P. e A. Sánchez (eds.) (2009), A Survey of Corpus-based Research. Panorama de investigaciones basadas en corpus, AELINCO: Murcia.
ERK, K. (2012). "Vector space models of word meaning and phrase meaning: A survey." Language and Linguistics Compass 6.10: 635-653.
Rocha, Marcos (2016)."Uma história da linguística computacional no âmbito das ciências cognitivas". Circumscribere:Int. J.for the History of Science,18
Además de las competencias generales propias de los estudios universitarios y especificadas en los títulos de Grado, los estudiantes de esta materia deberan alcanzar las siguientes competencias específicas:
4.1.1.Competencias disciplinares cognitivas (saber)
(1) Capacidad de reflexión crítica sobre las relaciones entre las lenguas y las nuevas tecnologías.
(2) Adquisición de las bases teórico-metodológicas de la Lingüística Computacional.
(3) Conocimiento de las herramientas, aplicaciones y recursos de naturaleza diversa desarrolladas por y para el estudio computacional de las lenguas.
(4) Comprensión, evaluación y aprovechamiento de estas herramientas y recursos.
4.1.2. Competencias profesionales procedimentales (saber hacer)
(1) Manejo eficaz de los recursos técnicos sobre lenguas y comunicación –incluidos los accesibles en línea– en particular los orientados a la investigación y a la formación en ámbitos lingüísticos, literarios, de creación o de investigación filológica.
(2) Capacidad para poner en práctica algunos de los conocimientos adquiridos en ámbitos como: traducción automática, confección y explotación de corpus lingüísticos, y reconocimiento y síntesis de habla.
4.1.3. Competencias académicas actitudinales (ser)
(1) Capacidad para poner en relación las distintas disciplinas en las que se sostiene el estudio computacional de las lenguas.
(2) Interés por la diversidad lingüística y cultural y sensibilidad en la valoración de sus repercusiones en el manejo y diseño de herramientas computacionales para el estudio de los fenómenos comunicativos.
(3) Capacidad para analizar, valorar y promover las aplicaciones técnicas de comunicación multimodal en aquellos casos de trastornos comunicativos derivados de lesiones motoras y/o sensoriales.
(4) Desarrollo de una actitud crítica ante el manejo y la gestión de las TIC y de Internet en los ámbitos académico, investigador y profesional.
En esta materia adoptaremos una metodología de enseñanza presencial que garantice la interacción entre el profesorado y los estudiantes sin que esto suponga minusvalorar el proceso de aprendizaje autónomo. Así, el curso de Lingüística Computacional se desarrollará a través de las clases presenciales (3 h. semanales) y del trabajo persoal de los estudiantes en horas no presenciales (estudio del temario a través de las lecturas obligatorias y preparación de los ejercicios de aplicación).
Las clases presenciales serán de tres tipos:
1. Sesiones expositivas (1 hora/semana): el profesorado proporcionará la información teórica básica de los temas del programa, reforzada con la presentación de diversos materiales representativos de los conceptos estudiados. Más concretamente, asignamos a cada tema de esta materia una serie de lecturas específicas recomendadas que presentan con claridad los contenidos teórico-prácticos sobre el procesamento lingüístico y sus aplicaciones informáticas.
2. Sesiones seminario o interactivas (2 horas/semana): en las sesiones de seminario se propondrán ejercicios prácticos, acompañados de explicaciones detalladas, para trabajar con los conceptos teóricos más relevantes.
3. Tutorías programadas (1 hora y media) con el objetivo de guiar el trabajo autónomo de los estudiantes.
Como complemento de las sesiones expositivas e interactivas, se habilitará un aula virtual que se utilizará para el depósito de los materiales digitales que el profesorado vaya preparando a lo largo del curso y para difundir cualquier tipo de información de interés general.
Los ejercicios de aplicación que los estudiantes elaborarán en las horas no presenciales responderán a los siguientes tipos:
a) Respuesta a cuestiones breves relacionadas con el contenido de los temas, que obliguen a enfrentarse con los aspectos de más difícil comprensión para aclarar las posibles dudas o que sirvan de aplicación práctica de conceptos explicados en las sesiones de clase.
b) Revisión crítica de distintas fuentes documentales relacionadas con los contenidos de la materia.
En líneas generales, los estudiantes deberán ser capaces de demostrar la asimilación de los contenidos y el dominio de las destrezas que contribuyan al desarrollo de competencias profesionales a través de la redacción y presentación oral de tareas que no solo estimulen la reflexión crítica a partir del material estudiado, sinó que además exijan la necesidad de tomar decisiones motivadas, anticipen problemas potenciales y propongan posibles soluciones desde la perspectiva de un/a investigador/a en Lingüística Computacional.
i) ESTUDIANTES QUE ASISTEN REGULARMENTE:
1ª OPORTUNIDAD:
Al comienzo del cuatrimestre, cada estudiante podrá escoger entre estas dos opciones de evaluación:
(a) Prueba final de toda la materia, que incluirá cuestiones de naturaleza teórica y práctica sobre la base de los contenidos presentados en las sesiones expositivas e interactivas así como de las lecturas básicas. Esta prueba se realizará en el aula de informática en la fecha establecida por la Secretaría de la Facultad (26/05/2025).
2) Evaluación continua (atendiendo a la distribución de la carga ECTS):
* un 70% de la calificación corresponderá al trabajo desarrollado en las sesiones interactivas
* un 30% de la calificación corresponderá al trabajo desarrollado en las sesiones expositivas
Los aspectos, criterios e instrumentos de la evaluación continuada aparecen reflejados en el siguiente esquema:
ASPECTOS
- Conceptos, métodos y herramientas aprendidos durante todo el curso
- Asistencia, participación y aprovechamiento de las sesiones
CRITERIOS
- Dominio de los conocimientos teóricos y operativos de la materia
- Aprovechamiento de las lecturas
- Participación activa en las sesiones
- Calidad científica de los trabajos: asimilación de contenidos, comprensión de los textos, análisis e interpretaciones adecuados.
INSTRUMENTOS
- Trabajos (entregados por escrito y/o expuestos de manera oral)
- Pruebas de evaluación de contenidos
2ª OPORTUNIDAD:
Cada estudiante podrá escoger entre estas dos opciones de evaluación:
(a) Prueba final de toda la materia, que incluirá cuestiones de naturaleza teórica y práctica sobre la base de los contenidos presentados en las sesiones expositivas e interactivas así como de las lecturas básicas. Esta prueba se realizará en el aula de informática en la fecha establecida por la Secretaría de la Facultad (01/07/2025).
(b) Presentación -hasta el 01/07/2025- de una nueva versión de aquellos trabajos de curso que no hubiesen alcanzado el nivel suficiente o, de ser el caso, se propondrían una serie de actividades substitutivas que se anunciarían en el momento de hacer públicas las calificaciones de la 1.ª oportunidad.
ii) ESTUDIANTES CON DISPENSA DE ASISTENCIA A CLASE
Las personas que tengan concedida por el Decanato la dispensa de asistencia a clase y, por lo tanto, no puedan seguir la evaluación continua, serán evaluadas exclusivamente a través de una prueba final de toda la materia que podrán realizar tanto en la 1.ª (26/05/2025) como en la 2.ª oportunidad (01/07/2025). Esta prueba incluirá cuestiones de naturaleza teórica y práctica sobre la base de los contenidos presentados en las sesiones expositivas e interactivas así como de las lecturas básicas.
iii) INDICACIÓN GENERAL PARA TODO EL ESTUDIANTADO: Para los casos de realización fraudulenta de ejercicios o pruebas será de aplicación lo recogido en la 'Normativa de evaluación del rendimiento académico de los estudiantes y de revisión de calificaciones'
https://www.xunta.gal/dog/Publicados/2011/20110721/AnuncioG2018-190711-…
Teniendo en cuenta el calendario oficial aprobado por la USC, la distribución temporal de la materia a lo largo del cuatrimestre queda como sigue:
DISTRIBUCIÓN DE LA CARGA ECTS
SESIONES EXPOSITIVAS: 14 (horas presenciales) + 66 (horas no presenciales) = Total 80 horas
SESIONES SEMINARIO: 28 (horas presenciales) + 36 (horas no presenciales) = Total 64 horas
SESIONES TUTORÍA GRUPO: 3 (horas presenciales) + 3 (horas no presenciales) = Total 6 horas
TOTAL: 45 (horas presenciales) + 106 (horas no presenciales) = Total 150 horas
No se requieren conocimientos previos, más allá de la formación básica adquirida hasta este momento en las materias de contenido lingüístico cursadas en los diferentes Grados; la materia está planificada para que pueda ser cursada por cualquier estudiante de la Facultad.
Se recomienda que el estudiantado posea habilidades para la lectura (con capacidad de síntesis) y comprensión crítica de la información recogida en diferentes soportes.
También conviene poseer un nivel medio-alto de comprensión escrita de las lenguas española, gallega e inglesa, ya que los materiales de consulta recomendados así como los empleados en las sesiones de clase incluyen textos publicados en estos idiomas.
Por otra parte, debe tenerse muy en cuenta que para superar la materia, además de alcanzar el nivel requerido en cuanto a contenidos y prácticas, será requisito indispensable mostrar en la realización de las diferentes pruebas –orales y/o escritas– un nivel de dominio (exposición y argumentación, redacción y ortografía) acorde con la situación académica.
(1) ATENCIÓN A ESTUDIANTES (HORARIO, LUGAR E INFORMACIÓN DE CONTACTO)
* Horario: será fijado al comienzo del 2.º cuatrimestre (aparecerá en la secretaría virtual y estará visible en la puerta del despacho de cada docente)
* Contacto:
- Prof. Marcos Garcia González: Filoloxía_gab. 129 | +34 881 811 769 || marcos.garcia.gonzalez [at] usc.gal (marcos[dot]garcia[dot]gonzalez[at]usc[dot]gal)
- Prof. Marcos Garcia González: CiTIUS_gab: 106 | +34 881 816 427
- Prof. Pablo Gamallo Otero: Filoloxía_gab. 126 | +34 881 811 772 || pablo.gamallo [at] usc.gal (pablo[dot]gamallo[at]usc[dot]gal)
- Prof. Pablo Gamallo Otero: CiTIUS_gab: 106 | +34 881 816 426
* Lengua vehicular de docencia: GALLEGO
Marcos Garcia Gonzalez
Coordinador/a- Departamento
- Lengua y Literatura Españolas, Teoría de la Literatura y Lingüística General
- Área
- Lingüística General
- Correo electrónico
- marcos.garcia.gonzalez [at] usc.gal
- Categoría
- Investigador/a: Ramón y Cajal
Pablo Gamallo Otero
- Departamento
- Lengua y Literatura Españolas, Teoría de la Literatura y Lingüística General
- Área
- Lingüística General
- Teléfono
- 881816426
- Correo electrónico
- pablo.gamallo [at] usc.gal
- Categoría
- Profesor/a: Catedrático/a de Universidad
Martes | |||
---|---|---|---|
11:00-12:00 | Grupo /CLIL_01 | Gallego | D02-Aula de informática de docencia |
12:00-13:00 | Grupo /CLIL_01 | Gallego | D02-Aula de informática de docencia |
26.05.2025 09:30-13:30 | Grupo /CLE_01 | D09 |
26.05.2025 09:30-13:30 | Grupo /CLIL_01 | D09 |
01.07.2025 09:30-13:30 | Grupo /CLIL_01 | D03 |
01.07.2025 09:30-13:30 | Grupo /CLE_01 | D03 |