Créditos ECTS Créditos ECTS: 5
Horas ECTS Criterios/Memorias Horas de Titorías: 5 Clase Expositiva: 15 Clase Interactiva: 20 Total: 40
Linguas de uso Alemán, Inglés
Tipo: Materia Ordinaria Máster RD 1393/2007 - 822/2021
Departamentos: Departamento externo vinculado ás titulacións
Áreas: Área externa M.U Erasmus Mundus en Lexicografía (2ªed)
Centro Facultade de Filoloxía
Convocatoria: Segundo semestre
Docencia: Con docencia
Matrícula: Matriculable | 1ro curso (Si)
O estudantado debería ser capaz de:
• Formular os seus requisitos de corpus para un proxecto lexicográfico e especificar o deseño dun corpus representativo;
• Compilar un corpus desde páxinas web ou outras fontes
• anotar o corpus con información lingüística mediante ferramentas automáticas de procesamento da linguaxe natural;
• Facer buscas no corpus con expresións regulares e con consultas más complexas baseadas en patróns lexico-gramaticais;
• Aplicar técnicas cuantitativas tales como análise de colocacións e palabras-chave e interpretar os resultados apropiadamente;
• Comunicar os resultados do seu traballo aos/ás compañeiros/as estudantes
• Levar a cabo discusións académicas sobre aspectos técnicos e metodolóxicos da investigación baseada en corpus; e
• Documentar e arquivar datos de corpus e analizar resultados
Fundacións de lingüística de corpus
• Principios e métodos de análise de corpus
• Aplicacións de datos de corpus en lexicografía
• Tipos de corpus, visión xeral dos corpus existentes
• Deseño de corpus, representatividade, fontes de datos, metadatos
Compilación de corpus
• Construción de corpus a partir de datos online: scraping da Web, etc.
• Limpeza de código de formato (boilerplate), normalización, extracción de metadatos
• Representación e intercambio de formatos
• Ferramentas online e autónomas para a compilación de corpus da Web
• Anotación automática lingüística (PoS, lema, NER, parsing, ...)
• Ferramentas online e autónomas para a anotación lingüística
Busca no corpus
• Expresións regulares
• Codificación de caracteres e estándar Unicode
• Consultas en linguaxe CQP para patróns léxico-gramatical
• Exercicios prácticos con SketchEngine e CQPweb
Análise cuantitativa
• Listas de frecuencia e distribución de metadatos
• Colocacións e sketches de palabras
• Análise de palabras-chave
• Interpretación lexicográfica dos resultados
• Fundacións da inferencia estatística
Reproducibilidade
• Metodoloxía de investigación e documentación
• Xestión de datos, sustentabilidade de fontes de corpus
HSK 5.4, Ch. XVIII + XIX
Coñecementos ou contidos: Con05, Con06, Con07, Con10
Habilidades ou destrezas: H/D01, H/D05, H/D07, H/D03
Competencias: Comp04, Comp03, Comp09
Seminario en bloque (data e duración a determinar)
1. Primeira oportunidade:
O/A profesor/a escolle un destes (recomendada a opción b):
a) Exame final de 90 minutos sobre os contidos do seminario
b) Presentación dun proxecto e mais un pequeno artigo (apr. 10 páxinas)
c) Artigo máis longo (15-20 páxinas)
2. Segunda oportunidade:
Aplicaranse os mesmos criterios que na primeira convocatoria.
O alumnado con dispensa oficial será avaliado seguindo os mesmos criterios.
Para os casos de realización fraudulenta de exercicios ou probas será de aplicación o recollido na “Normativa de avaliación do rendemento académico dos estudantes e de revisión de cualificacións”
Horas presenciais: max. 35.
Requirements for participation: Students must obtain 25 ECTS in the first semester
Elective module in the second semester.
Language: German and/or English
Requisitos de participación: O estudantado debe obter 25 ECTS no primeiro semestre.
Módulo optativo do segundo semestre.
Lingua de ensino: alemán e/ou inglés.