Créditos ECTS Créditos ECTS: 4.5
Horas ECTS Criterios/Memorias Traballo do Alumno/a ECTS: 76.5 Horas de Titorías: 4.5 Clase Expositiva: 13.5 Clase Interactiva: 18 Total: 112.5
Linguas de uso Castelán, Galego
Tipo: Materia Ordinaria Máster RD 1393/2007 - 822/2021
Departamentos: Electrónica e Computación
Áreas: Ciencia da Computación e Intelixencia Artificial, Linguaxes e Sistemas Informáticos
Centro Escola Técnica Superior de Enxeñaría
Convocatoria: Primeiro semestre
Docencia: Con docencia
Matrícula: Matriculable | 1ro curso (Si)
O gran volume de datos xerados diariamente de tipo non estruturado ou semiestruturado fai necesaria a aplicación de técnicas de rastrexo, procesamento, indexación e recuperación que proporcionen acceso eficiente e eficaz a ese tipo de contidos, que poden estar nunha gran variedade de formatos (por exemplo, texto, web, xml, imaxes, video).
Esta materia proporciona formación en tecnoloxía de recuperación de información, necesaria para a xestión de masivos repositorios documentais, así como aspectos relacionados como o procesamento de linguaxe natural e a extracción de información. Tamén se tratan outras tecnoloxías de Minería de Textos e Web como a clasificación e o agrupamento documental.
Motores de procura e Recuperación de Información
Procesamento de Texto, construción de índices invertidos e compresión
Modelos de recuperación de información (vectoriais, probabilísticos), Realimentación de relevancia e expansión de consultas.
Recuperación de Información semi-estruturada: recuperación XML.
Avaliación de sistemas de Recuperación de Información
Busca web (rastrexo, indexación, análise de enlaces)
Recuperación de Información multimedia (imaxes, video)
Extracción de información
Clasificación e agrupamento documental
Outros aspectos de Minería de Texto e Minaría Web
Textos basicos:
Zhai, C., Massung, S. Text Data Management and Analysis: a practical introduction to information retrieval and text mining. 1ª edición. Lugar de publicación: EEUU. ACM and Morgan & Claypool publishers, 2016. ISBN: 978-1-97000-119-8
Textos complementarios:
Manning, C.D., Raghavan, P., Schütze, H. Introduction to Information Retrieval, 1ª edición. Lugar de publicación: New York. Cambridge University Press. 2008. ISBN: 978-0-521-86571-5
Croft, B., Metzler, D., Strohman. T. Search Engines: Information Retrieval in practice. 1ª edición, Lugar de publicación: New Jersey. Pearson, 2010. ISBN: 9780131364899
Baeza-Yates, R., Ribeiro-Neto, B. Modern Information Retrieval: the concepts and technology behind search, 2ª edición. Lugar de publicación: Essex. Pearson, 2011. ISBN: 978-0-321-41691-9
Cacheda, F., Fernández-Luna, J.M., Huete, J. Recuperación de Información. Un enfoque práctico y multidisciplinar. 1ª edición, Lugar de publicación: Madrid. Ra-Ma, 2011. ISBN: 9788499641126
O alumnado coñecerá distintos modelos de recuperación de información e análise de textos e comprenderá os seus beneficios e inconvintes para o tratamento de masivos repositorios de datos de distinta índole.
O alumnado será capaz de implementar software para o rastrexo, procesamento, indexación e recuperación de datos non estruturados ou semi-estruturados
O alumnado comprenderá a metodoloxía de avaliación de sistemas de busca e será capaz de validar empiricamente estratexias de busca e clasificación de contidos
O alumnado coñecerá as principais estratexias de Minaría de Texto e Web e poderá implementalas en proxectos reais
O alumnado adquirirá a habilidade necesaria para a busca, selección e manexo de recursos (bibliografía, software, etc.) relacionados con esta materia
Competencias da titulación que se traballan (ver memoria título):
- Básicas: CB6, CB7, CB8, CB10
- Transversais/Xerais: G1, G2, G4, T4, T7
- Específicas: E1, E2
Clases teóricas, nas que se expón o contido de cada tema. O alumnado disporá de copias das transparencias con anterioridade e o profesorado promoverá unha actitude activa, realizando preguntas que permitan aclarar aspectos concretos e deixando cuestións abertas para a reflexión do alumnado.
Clases prácticas con uso de ordenador, que permiten ao alumnado familiarizarse dende un punto de vista práctico coas cuestións expostas nas clases teóricas.
Actividades formativas de carácter presencial e a súa relación coas competencias da titulación:
Clases teóricas: impartidas polo profesorado e exposición de seminarios: CB6, CB8, CB10, E1, E2
Clases prácticas de laboratorio, resolución de problemas e casos prácticos: CB7, CB8, CB10, E1, E2
Titorías programadas: orientación para a realización dos traballos individuais ou en grupo, resolución de dúbidas e actividades de avaliación continua: CB6, CB7, CB8, CB10, G1, T4, G2, G4, T5, E1, E2
Exame: CB6, CB7, CB8, CB10, G1, T4, G2, G4, T5, E1, E2
Actividades formativas de carácter non presencial e a súa relación coas competencias da titulación:
Traballo persoal do alumnado: consulta de bibliografía, estudo autónomo, desenvolvemento de actividades programadas, preparación de presentacións e traballos: E1, E2, CB6, CB7, CB8, CB10, G1, T4, G2, G4, T5
Realización de prácticas: 60%
Probas periódicas e/ou exame final: 30%
Seguimento continuado e obxectivable dunha participación activa: 10%
Para superar a materia é necesario que polo menos un 10% da nota total fose obtida nas Probas periódicas e/ou examen final
A avaliación na segunda oportunidade é exactamente igual que na primeira oportunidade (entrega de prácticas, realización de probas e seguimiento de participación activa).
Para os casos de realización fraudulenta de exercicios ou probas será de
aplicación o recollido na Normativa de avaliación do rendemento académico dos/as
estudantes e de revisión de cualificacións
Clases expositivas: 18 h + 33 h traballo autónomo do alumnado
Clases interactivas: 13.5 h +33 h traballo autónomo do alumnado
Tutorias e Actividades de avaliación: 4 h +11 h traballo autónomo do alumnado
Total: 112.5 h
Completar a formación obtida en clase coa lectura dos correspondentes capítulos nos libros de referencia, realizar todos os exercicios prácticos propostos e familiarizarse coas plataformas e librerías utilizadas para a experimentación e desenvolvemento con sistemas de procura e minería de texto.
Antonio Mosquera Gonzalez
- Departamento
- Electrónica e Computación
- Área
- Linguaxes e Sistemas Informáticos
- Teléfono
- 881813567
- Correo electrónico
- antonio.mosquera [at] usc.es
- Categoría
- Profesor/a: Titular de Universidade
David Enrique Losada Carril
Coordinador/a- Departamento
- Electrónica e Computación
- Área
- Ciencia da Computación e Intelixencia Artificial
- Teléfono
- 881816451
- Correo electrónico
- david.losada [at] usc.es
- Categoría
- Profesor/a: Catedrático/a de Universidade
Martes | |||
---|---|---|---|
16:00-17:15 | Grupo /CLE_01 | Castelán | PROXECTOS |
08.01.2025 16:00-19:45 | Grupo /CLIL_01 | IA.01 |
08.01.2025 16:00-19:45 | Grupo /CLE_01 | IA.01 |
03.07.2025 16:00-19:45 | Grupo /CLIL_01 | IA.01 |
03.07.2025 16:00-19:45 | Grupo /CLE_01 | IA.01 |