Créditos ECTS Créditos ECTS: 3
Horas ECTS Criterios/Memorias Trabajo del Alumno/a ECTS: 51 Horas de Tutorías: 3 Clase Expositiva: 9 Clase Interactiva: 12 Total: 75
Lenguas de uso Castellano, Gallego
Tipo: Materia Ordinaria Máster RD 1393/2007 - 822/2021
Departamentos: Lengua y Literatura Españolas, Teoría de la Literatura y Lingüística General
Áreas: Lingüística General
Centro Facultad de Filología
Convocatoria: Primer semestre
Docencia: Con docencia
Matrícula: Matriculable | 1ro curso (Si)
La materia tiene los siguientes objetivos específicos:
1. Introducir metodologías computacionales en el área de las tecnologías lingüísticas, concretamente en los campos del Procesamento del Lenguaje Natural (etiquetación y análisis de texto) y de la Extracción de Información a partir de corpus.
2. Ayudar a utilizar herramientas de Procesamento del Lenguaje Natural y de Extracción de Información.
3. Tener capacidad para operar en las áreas del Procesamento del Lenguaje Natural y de la Extracción de Información, aplicando las herramientas automáticas adecuadas a la resolución de problemas específicos.
4. Ayudar a comprender cómo se diseñan y construyen las herramientas utilizadas.
1. Etiquetadores morfológicos y analizadores sintácticos: concepto, diseño y explotación
1.1 Léxicos computacionales
1.2 Corpus de entrenamiento
1.3 Gramáticas formales
2. Técnicas de extracción de unidades multipalabra y entidades mencionadas
2.1 Uso de etiquetadores morfológicos para la extracción de multipalabras
2.2 Reconocimiento y clasificación de entidades mencionadas
3. Estrategias de construcción de ontologías y extracción semántica
3.1. Uso de analizadores sintácticos en la extracción semántica
3.2 Extracción de relaciones semánticas entre palabras
3.3 Técnicas de resolución de anáfora y correferencia para mejorar la extracción..
4. Aplicaciones de Procesamiento del Lenguaje Natural
4.1 Traducción automática
4.2 Resumen automático
4.3 Minería de opinión
4.4 Búsqueda de respuestas
Armstrong, Susan, Natural language processing using very large corpora, Dordrecht : Kluwer Academic Publishers, 1999.
Barnabas Jozef van Bakel, A Linguistic approach to automatic information extraction. Holanda: Bas van Bakel, 1997.
Berber Sardinha, Tony, Lingüística de Corpus, Editora Manole, Brasil., 2004.
Civit, Monserrat, Criterios de etiquetación y desambiguación morfosintáctica de corpus en español. Colección de Monografías de la Sociedad Española para el Procesamiento del Lenguaje Natural, 3, 2003.
Clark, Alexander, Chris Fox, Shalom Lappin, The Handbook of Computational Linguistics and Natural Language Processing, Wiley-Blackwell, 2010.
Cruz Mata, Fermín, Extracción de Opiniones sobre Características: Un Enfoque Práctico Adaptable al Dominio, Colección de Monografías de la Sociedad Española para el Procesamiento del Lenguaje Natural, 11, 2012.
Gamallo, Pablo, González, Isaac: Una gramática de dependencias basada en patrones de etiquetas" , Procesamiento del Lenguaje Natural, 43, 2009, p. 315-324.
Gamallo, Pablo, González, Isaac: “A Grammatical Formalism Based on Patterns of Part-of-Speech Tags“, International Journal of Corpus Linguistics, 16 (1), 2011, p. 45-71.
Gamallo, Pablo, “Tutorial of DepPattern: How to write a grammar with DepPattern”, http://gramatica.usc.es/pln/tools/deppattern.html, 2009.
García Cumbreras, Miguel Ángel, BRUJA: Un Sistema de Búsqueda de Respuestas Multilingüe,Colección de Monografías de la Sociedad Española para el Procesamiento del Lenguaje Natural, 9, 2010.
Gelbukh, Alexander e Grigori Sidorov, Procesamiento automático del español con enfoque en recursos léxicos grandes, México, D. F. : Instituto Politécnico Nacional, Centro de Investigación en Computación, Direción de Publicaciones, 2006.
Llisterri, J. “Lingüística y tecnologías del lenguaje”. Lynx. Panorámica de Estudios Lingüísticos 2, 2003, 9-71.
Moreno, L, Palomar, M. Molina, A, Fernández, A., Introducción al Procesamiento del Lenguaje Natural, Servicio de Publicaciones Universidad de Alicante, 1999.
Peñas, Anselmo, Técnicas lingüísticas aplicadas a la búsqueda textual multilingüe. Ambigüedad, variación terminológica y multilingüismo, Colección de Monografías de la Sociedad Española para el Procesamiento del Lenguaje Natural, 4, 2004.
Ruiz Antón, Juan Carlos: “Algunas reflexiones sobre la aplicación computacional de la gramática de dependencias”, Homenaje al profesor A. Roldán Pérez, 2, 1997, p. 523-536.
La principal competencia específica que los estudiantes deberán adquirir es la siguiente:
- Capacidad en el manejo de diferentes tecnologías lingüísticas que conforman la actual sociedad del conocimiento, concretamente herramientas de análisis textual (etiquetadores morfosintácticos y parsers sintácticos), así como sistemas de extracción de información a partir de texto: extractores de términos, multipalabras, relaciones semánticas, etc.
En relación a las competencias básicas, destacamos las siguientes:
- Poseer y comprender conocimientos que permitan ser originales en el desarrollo y/o aplicación de ideas en un contexto de investigación.
- Aplicar los conocimientos adquiridos y la capacidad de resolución de problemas a nuevos entornos (o poco conocidas) dentro de contextos más amplios (o multidisciplinares) relacionados con el área de estudio.
- Integrar conocimientos y enfrentarse a la complejidad de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones sobre las responsabilidades sociales y éticas.
- Saber comunicar conclusiones -y los conocimientos y razones últimas que los sustentan- a un público especializado de una manera clara y sin ambigüedad.
- Poseer habilidades de aprendizaje para continuar estudiando de una manera autodirigida y autónoma.
Por último, enumerarmos las principales competencias transversales que deberán adquirir los estudiantes:
- Compresión de la importancia de la cultura emprendedora y conocimiento de los medios al alcance de las personas emprendedoras.
- Valoración crítica del conocimiento, la tecnología y la información disponible para resolver los problemas a los que deben enfrentarse.
- Valoración de la importancia que tiene la investigación, la innovación y el desarrollo tecnológico en el avance socio-económico y cultural de la sociedad.
- Utilización de las herramientas básicas de las tecnologías de la información y de la comunicación (TIC) necesarias para el ejercicio de su profesión y para el aprendizaje al largo de su vida.
Las sesiones tendrán un doble componente, expositivo e interactivo, siendo este último el más importante dados los contenidos del curso .
La metodología docente se basará fundamentalmente en sesiones presenciales interactivas que fomenten tanto el trabajo individual como el trabajo colaborativo. Dado que se requerirá el manejo de diferentes aplicaciones para el análisis lingüístico y la extracción de información, los estudiantes desarrollarán la capacidad instrumental correspondiente al dominio de aplicaciones informáticas dentro del área de las tecnologías del lenguaje.
El curso consistirá básicamente en la realización de un conjunto de actividades prácticas descritas con detalle en el material didáctico. El estudiante deberá llevar a cabo las actividades individualmente o/y en grupo, potenciando especialmente la capacidad instrumental para la resolución de problemas.
Cada estudiante propondrá, además, la descripción y realización de un trabajo final tutelado, que consistirá en el desarrollo en profundidad de alguna de las actividades llevadas a cabo durante las sesiones presenciales.
Se utilizará el aula virtual para la distribución de materiales, así como guías y tutoriais para la realización de las actividades requeridas.
La evaluación tendrá en cuenta la asistencia y participación en clase y, en particular, la implicación en la realización de las actividades guiadas propuestas en las sesiones interactivas. Se tendrá en cuenta también para la evaluación la calidad del trabajo final desarrollado.
En la siguiente tabla se recogen los aspectos evaluables y los criterios de evaluación:
- Trabajo final tutelado: 70% de la nota final
- Actividades guiadas en sesiones presenciales: 20% de la nota final
- Asistencia: 10% de la nota final.
2.ª oportunidad (mes de julio)
Se limitará a la entrega del trabajo tutelado (con un peso del 70%). Al respeto del 30% restante, se mantiene la nota obtenida en la primera oportunidad.
En caso de dispensa académica, el criterio de evaluación es la realización de un trabajo que tendrá un peso del 100% sobre la nota final. Este criterio será el mismo en las dos oportunidades.
Para los casos de realización fraudulenta de ejercicios o pruebas será de aplicación lo recogido en la Normativa de evaluación del rendimiento académico de los estudiantes y de revisión de calificaciones.
Para seguir la materia, además de las sesiones presenciales, 15 horas, son precisas otras 60 horas, de las cuales el 50% debe reservarse para la elaboración del trabajo o proyecto final.
Es importante adquirir algunos mecanismos y automatismos básicos para el uso del sistema operativo Linux, sistema sobre el que se ejecutarán las herramientas utilizadas en el curso. Por este motivo, se recomienda repetir y ampliar de manera individual -en la casa o en las salas de informática de la Facultad- las prácticas realizadas en las sesiones interactivas.
Pablo Gamallo Otero
Coordinador/a- Departamento
- Lengua y Literatura Españolas, Teoría de la Literatura y Lingüística General
- Área
- Lingüística General
- Teléfono
- 881816426
- Correo electrónico
- pablo.gamallo [at] usc.gal
- Categoría
- Profesor/a: Catedrático/a de Universidad
Lunes | |||
---|---|---|---|
16:00-19:00 | Grupo /CLE_01 | Gallego | B13-Sala de videoconferencias |
Martes | |||
16:00-19:00 | Grupo /CLE_01 | Gallego | B13-Sala de videoconferencias |
Miércoles | |||
16:00-19:00 | Grupo /CLE_01 | Gallego | B13-Sala de videoconferencias |
Jueves | |||
16:00-19:00 | Grupo /CLIS_01 | Gallego | B13-Sala de videoconferencias |
23.01.2025 18:00-20:00 | Grupo /CLIS_01 | C05 |
23.01.2025 18:00-20:00 | Grupo /CLE_01 | C05 |
04.07.2025 18:00-20:00 | Grupo /CLIS_01 | C05 |
04.07.2025 18:00-20:00 | Grupo /CLE_01 | C05 |