Créditos ECTS Créditos ECTS: 3
Horas ECTS Criterios/Memorias Traballo do Alumno/a ECTS: 51 Horas de Titorías: 3 Clase Expositiva: 9 Clase Interactiva: 12 Total: 75
Linguas de uso Castelán, Galego
Tipo: Materia Ordinaria Máster RD 1393/2007 - 822/2021
Departamentos: Lingua e Literatura Españolas, Teoría da Literatura e Lingüística Xeral
Áreas: Lingüística Xeral
Centro Facultade de Filoloxía
Convocatoria: Primeiro semestre
Docencia: Con docencia
Matrícula: Matriculable | 1ro curso (Si)
A materia ten o seguintes obxectivos específicos:
1. Introducir metodoloxías computacionais na área das tecnoloxías lingüísticas, concretamente nos campos do Procesamento da Linguaxe Natural (etiquetación e análise de texto) e da Extracción de Información a partir de corpus.
2. Axudar a utilizar ferramentas de Procesamento da Linguaxe Natural e de Extracción de Información.
3. Ter capacidade para operar nas áreas do Procesamento da Linguaxe Natural e da Extracción de Información, aplicando as ferramentas automáticas adecuadas na resolución de problemas específicos.
4. Axudar a comprender como se deseñan e constrúen as ferramentas utilizadas.
1. Etiquetadores morfolóxicos e analizadores sintácticos: concepto, deseño e explotación
1.1 Léxicos computacionais
1.2 Corpus de entrenamento
1.3 Gramáticas formais
2. Técnicas de extracción de unidades multipalabra e entidades mencionadas
2.1 Uso de etiquetadores morfolóxicos para a extracción de multipalabras
2.2 Recoñecemento e clasificación de entidades mencionadas
3. Estratexias de construcción de ontoloxías e extracción semántica
3.1. Uso de analizadores sintácticos na extracción semántica
3.2 Extracción de relacións semánticas entre palabras
3.3 Técnicas de resolución de anáfora e correferencia para mellorar a extracción.
4. Aplicacións de Procesamento da Linguaxe Natural
4.1 Tradución automática
4.2 Resume automático
4.3 Minería de opinión
4.4 Busca de respostas
Armstrong, Susan, Natural language processing using very large corpora, Dordrecht : Kluwer Academic Publishers, 1999.
Barnabas Jozef van Bakel, A Linguistic approach to automatic information extraction. Holanda: Bas van Bakel, 1997.
Berber Sardinha, Tony, Lingüística de Corpus, Editora Manole, Brasil., 2004.
Civit, Monserrat, Criterios de etiquetación y desambiguación morfosintáctica de corpus en español. Colección de Monografías de la Sociedad Española para el Procesamiento del Lenguaje Natural, 3, 2003.
Clark, Alexander, Chris Fox, Shalom Lappin, The Handbook of Computational Linguistics and Natural Language Processing, Wiley-Blackwell, 2010.
Cruz Mata, Fermín, Extracción de Opiniones sobre Características: Un Enfoque Práctico Adaptable al Dominio, Colección de Monografías de la Sociedad Española para el Procesamiento del Lenguaje Natural, 11, 2012.
Gamallo, Pablo, González, Isaac: Una gramática de dependencias basada en patrones de etiquetas" , Procesamiento del Lenguaje Natural, 43, 2009, p. 315-324.
Gamallo, Pablo, González, Isaac: “A Grammatical Formalism Based on Patterns of Part-of-Speech Tags“, International Journal of Corpus Linguistics, 16 (1), 2011, p. 45-71.
Gamallo, Pablo, “Tutorial of DepPattern: How to write a grammar with DepPattern”, http://gramatica.usc.es/pln/tools/deppattern.html, 2009.
García Cumbreras, Miguel Ángel, BRUJA: Un Sistema de Búsqueda de Respuestas Multilingüe,Colección de Monografías de la Sociedad Española para el Procesamiento del Lenguaje Natural, 9, 2010.
Gelbukh, Alexander e Grigori Sidorov, Procesamiento automático del español con enfoque en recursos léxicos grandes, México, D. F. : Instituto Politécnico Nacional, Centro de Investigación en Computación, Direción de Publicaciones, 2006.
Llisterri, J. “Lingüística y tecnologías del lenguaje”. Lynx. Panorámica de Estudios Lingüísticos 2, 2003, 9-71.
Moreno, L, Palomar, M. Molina, A, Fernández, A., Introducción al Procesamiento del Lenguaje Natural, Servicio de Publicaciones Universidad de Alicante, 1999.
Peñas, Anselmo, Técnicas lingüísticas aplicadas a la búsqueda textual multilingüe. Ambigüedad, variación terminológica y multilingüismo, Colección de Monografías de la Sociedad Española para el Procesamiento del Lenguaje Natural, 4, 2004.
Ruiz Antón, Juan Carlos: “Algunas reflexiones sobre la aplicación computacional de la gramática de dependencias”, Homenaje al profesor A. Roldán Pérez, 2, 1997, p. 523-536.
A principal competencia específica que os estudantes deberán adquirir é a seguinte:
- Capacidade no manexo de diferentes tecnoloxías lingüísticas que conforman a actual sociedade do coñecemento, concretamente ferramentas de análise textual (etiquetadores morfosintácticos e parsers sintácticos), así como sistemas de extracción de información a partir de texto: extractores de termos, de multipalabras, de relacións semánticas, etc.
En relación ás competencias básicas, salientamos as seguintes:
- Posuír e comprender coñecementos que permitan seren orixinais no desenvolvemento e/ou aplicación de ideas nun contexto de investigación.
- Aplicar os coñecementos adquiridos e a capacidade de resolución de problemas a novas contornas (ou pouco coñecidas) dentro de contextos máis amplos (ou multidisciplinares) relacionados coa área de estudo.
- Integrar coñecementos e enfrontarse á complexidade de formular xuízos a partir dunha información que, sendo incompleta ou limitada, inclúa reflexións sobre as responsabilidades sociais e éticas.
- Saber comunicar conclusións -e os coñecementos e razóns últimas que os sustentan- a un público especializado dun xeito claro e sen ambigüidades.
- Posuír habilidades de aprendizaxe para continuar estudando dun xeito autodirixido e autónomo.
Por último, enumerarmos as principais competencias transversais que deberán adquirir os estudantes:
- Compresión da importancia da cultura emprendedora e coñecemento dos medios ao alcance das persoas emprendedoras.
- Valoración crítica do coñecemento, a tecnoloxía e a información dispoñíbel para resolver os problemas aos que deben enfrontarse.
- Valoración da importancia que ten a investigación, a innovación e o desenvolvemento tecnolóxico no avance socio-económico e cultural da sociedade.
- Utilización das ferramentas básicas das tecnoloxías da información e da comunicación (TIC) necesarias para o exercicio da súa profesión e para a aprendizaxe ao longo da súa vida.
As sesións terán un dobre compoñente, expositivo e interactivo, sendo este último o máis importante dados os contidos do curso .
A metodoloxía docente basearase fundamentalmente en sesións presenciais interactivas que fomenten tanto o traballo individual como o traballo colaborativo. Dado que se requirirá o manexo de diferentes aplicacións para a análise lingüística e a extracción de información, os estudantes desenvolverán a capacidade instrumental correspondente ao dominio de aplicacións informáticas dentro da área das tecnoloxías da linguaxe.
O curso consistirá basicamente na realización dun conxunto de actividades prácticas descritas con detalle no material didáctico. O estudante deberá levar a cabo as actividades individualmente ou/e en grupo, potenciando especialmente a capacidade instrumental para a resolución de problemas.
Cada estudante proporá, ademais, a descrición e realización dun traballo final tutelado, que consistirá no desenvolvemento en profundidade dalgunha das actividades levadas a cabo durante as sesións presenciais.
Utilizarase a aula virtual para a distribución de materiais, así como guías e tutoriais para a realización das actividades requiridas.
A avaliación terá en conta a asistencia e participación en clase e, en particular, a implicación na realización das actividades guiadas propostas nas sesións interactivas. Terase en conta tamén para a avaliación a calidade do traballo final desenvolvido.
Na seguinte táboa recóllense os aspectos avaliabeis e os criterios de avaliación:
- Traballo final tutelado: 70% da nota final
- Actividades guiadas en sesións presenciais: 20% da nota final
- Asistencia: 10% da nota final.
2.ª oportunidade (mes de xullo)
Limitarase á entrega do traballo tutelado (cun peso do 70%). Ao respecto do 30% restante, mantense a nota obtida na primeira oportunidade.
En caso de dispensa académica, o criterio de avaliación é a realización dun traballo que terá un peso do 100% sobre aa nota final. Este criterio será o mesmo nas dúas oportunidades.
Para os casos de realización fraudulenta de exercicios ou probas será de aplicación o recollido na Normativa de avaliación do rendemento académico dos estudantes e de revisión de cualificacións.
Para seguir a materia, ademais das sesións presenciais, 15 horas, son precisas outras 60 horas, das cales o 50% debe reservarse para a elaboración do traballo ou proxecto final.
É importante adquirir algúns mecanismos e automatismos básicos para o uso do sistema operativo Linux, sistema sobre o que se executarán as ferramentas utilizadas no curso. Por este motivo, recoméndase repetir e ampliar de xeito individual -na casa ou nas salas de informática da Facultade- as prácticas realizadas nas sesións interactivas.
Pablo Gamallo Otero
Coordinador/a- Departamento
- Lingua e Literatura Españolas, Teoría da Literatura e Lingüística Xeral
- Área
- Lingüística Xeral
- Teléfono
- 881816426
- Correo electrónico
- pablo.gamallo [at] usc.gal
- Categoría
- Profesor/a: Titular de Universidade
Luns | |||
---|---|---|---|
16:00-19:00 | Grupo /CLE_01 | Galego | B13-Sala de videoconferencias |
Martes | |||
16:00-19:00 | Grupo /CLE_01 | Galego | B13-Sala de videoconferencias |
Mércores | |||
16:00-19:00 | Grupo /CLE_01 | Galego | B13-Sala de videoconferencias |
Xoves | |||
16:00-19:00 | Grupo /CLIS_01 | Galego | B13-Sala de videoconferencias |
23.01.2025 18:00-20:00 | Grupo /CLIS_01 | C05 |
23.01.2025 18:00-20:00 | Grupo /CLE_01 | C05 |
04.07.2025 18:00-20:00 | Grupo /CLIS_01 | C05 |
04.07.2025 18:00-20:00 | Grupo /CLE_01 | C05 |