Créditos ECTS Créditos ECTS: 5
Horas ECTS Criterios/Memorias Horas de Tutorías: 5 Clase Expositiva: 15 Clase Interactiva: 20 Total: 40
Lenguas de uso Alemán, Inglés
Tipo: Materia Ordinaria Máster RD 1393/2007 - 822/2021
Departamentos: Departamento externo vinculado a las titulaciones
Áreas: Área externa M.U Erasmus Mundus en Lexicografía (2ªed)
Centro Facultad de Filología
Convocatoria: Segundo semestre
Docencia: Con docencia
Matrícula: Matriculable | 1ro curso (Si)
El alumnado debería ser capaz de:
• Formular los requisitos del corpus para un proyecto lexicográfico y especificar el diseño de un corpus representativo;
• Compilar un corpus desde páginas web u otras fuentes;
• Anotar el corpus con información lingüística mediante herramientas automáticas de procesamento del lenguaje natural;
• Hacer búsquedas en el corpus con expresiones regulares y con consultas más complejas basadas en patrones léxico-gramaticales;
• Aplicar técnicas cuantitativas tales como el análisis de colocaciones y palabras-clave e interpretar los resultados apropiadamente;
• Comunicar los resultados de su trabajo a los/las compañeros/as;
• Llevar a cabo discusiones académicas sobre aspectos técnicos y metodológicos de la investigación basada en corpus;
• Documentar y archivar datos de corpus y analizar resultados.
Fundamentos de lingüística de corpus
• Principios y métodos de análisis de corpus
• Aplicaciones de datos de corpus en lexicografía
• Tipos de corpus, visión general de los corpus existentes
• Diseño de corpus, representatividad, fuentes de datos, metadatos
Compilación de corpus
• Construcción de corpus a partir de datos online: scraping de la Web, etc.
• Limpieza de código de formato (boilerplate), normalización, extracción de metadatos
• Representación e intercambio de formatos
• Herramientas online y autónomas para la compilación de corpus de la Web
• Anotación automática lingüística (POLVOS, léemela, NER, parsing, ...)
• Herramientas online y autónomas para la anotación lingüística
Búsqueda en corpus
• Expresiones regulares
• Codificación de caracteres y estándar Unicode
• Consultas en lenguaje CQP para patrones léxico-gramatical
• Ejercicios prácticos con SketchEngine y CQPweb
Análisis cuantitativo
• Listas de frecuencia y distribución de metadatos
• Colocaciones y sketches de palabras
• Análisis de palabras-llave
• Interpretación lexicográfica de los resultados
• Fundamentos de la inferencia estadística
Reproducibilidad
• Metodología de investigación y documentación
• Gestión de datos, sostenibilidad de fuentes de corpus
HSK 5.4, Ch. XVIII + XIX
Conocimientos o contenidos: Con05, Con06, Con07, Con10
Habilidades o destrezas: H/D01, H/D05, H/D07, H/D03
Competencias: Comp04, Comp03, Comp09
Seminario en bloque (fecha y duración a determinar)
1. Primera oportunidad:
El/la profesor/a escoge uno de estos (recomendada la opción b):
la) Examen final de 90 minutos sobre los contenidos del seminario
b) Presentación de un proyecto y un pequeño artículo (apr. 10 páginas)
c) Artículo más largo (15-20 páginas)
2. Segunda oportunidad:
Se aplicarán los mismos criterios que en la primera convocatoria.
El alumnado con dispensa oficial será evaluado siguiendo los mismos criterios.
Para los casos de realización fraudulenta de ejercicios o probas será de aplicación lo recogido en la “Normativa de avaliación do rendemento académico dos estudantes e de revisión de cualificacións”.
Horas presenciales: max. 35.
Requirements for participation: Students must obtain 25 ECTS in the first semester
Elective module in the second semester.
Language: German and/or English
Requisitos de participación: El alumnado debe obtener 25 ECTS en el primer semestre.
Módulo optativo del segundo semestre.
Lengua de enseñanza: alemán y/o inglés.