ECTS credits ECTS credits: 4.5
ECTS Hours Rules/Memories Student's work ECTS: 76.5 Hours of tutorials: 4.5 Expository Class: 13.5 Interactive Classroom: 18 Total: 112.5
Use languages Spanish, Galician
Type: Ordinary subject Master’s Degree RD 1393/2007 - 822/2021
Departments: Electronics and Computing
Areas: Computer Science and Artificial Intelligence, Languages and Computer Systems
Center Higher Technical Engineering School
Call: First Semester
Teaching: With teaching
Enrolment: Enrollable | 1st year (Yes)
El gran volumen de datos generados diariamente de tipo no estructurado o semiestructurado hace necesaria la aplicación de técnicas de rastreo, procesamiento, indexación y recuperación que proporcionen acceso eficiente y eficaz a ese tipo de contenidos, que pueden estar en una gran variedad de formatos (por ejemplo, texto, web, xml, imágenes, video).
Esta materia proporciona formación en tecnología de recuperación de información, necesaria para la gestión de masivos repositorios documentales, así como aspectos relacionados como el procesamiento de lenguaje natural y la extracción de información. También se tratan otras tecnologías de Minería de Textos y Web como la clasificación y el agrupamiento documental.
Motores de búsqueda y Recuperación de Información
Procesamiento de Texto, construcción de índices invertidos y compresión
Modelos de recuperación de información (vectoriales, probabilísticos), realimentación de relevancia y expansión de consultas.
Recuperación de Información semi-estructurada: recuperación XML.
Evaluación de sistemas de RI
Búsqueda web (rastreo, indexación, análisis de enlaces)
Recuperación de Información multimedia (imágenes, video)
Extracción de información
Clasificación y agrupamiento documental
Otros aspectos de Minería de Texto y Minería Web
Textos basicos:
Zhai, C., Massung, S. Text Data Management and Analysis: a practical introduction to information retrieval and text mining. 1ª edición. Lugar de publicación: EEUU. ACM and Morgan & Claypool publishers, 2016. ISBN: 978-1-97000-119-8
Textos complementarios:
Manning, C.D., Raghavan, P., Schütze, H. Introduction to Information Retrieval, 1ª edición. Lugar de publicación: New York. Cambridge University Press. 2008. ISBN: 978-0-521-86571-5
Croft, B., Metzler, D., Strohman. T. Search Engines: Information Retrieval in practice. 1ª edición, Lugar de publicación: New Jersey. Pearson, 2010. ISBN: 9780131364899
Baeza-Yates, R., Ribeiro-Neto, B. Modern Information Retrieval: the concepts and technology behind search, 2ª edición. Lugar de publicación: Essex. Pearson, 2011. ISBN: 978-0-321-41691-9
Cacheda, F., Fernández-Luna, J.M., Huete, J. Recuperación de Información. Un enfoque práctico y multidisciplinar. 1ª edición, Lugar de publicación: Madrid. Ra-Ma, 2011. ISBN: 9788499641126
El alumnado conocerá distintos modelos de recuperación de información y análisis de textos y comprenderá sus beneficios e inconvenientes para el tratamiento de masivos repositorios de datos de distinta índole.
El alumnado será capaz de implementar software para el rastreo, procesamiento, indexación y recuperación de datos no estructurados o semi-estructurados
El alumnado comprenderá la metodología de evaluación de sistemas de búsqueda y será capaz de validar empíricamente estrategias de búsqueda y clasificación de contenidos
El alumnado conocerá las principales estrategias de Minería de Texto y Web y podrá implementarlas en proyectos reales
El alumnado adquirirá la habilidad necesaria para la búsqueda, selección y manejo de recursos (bibliografía, software, etc.) relacionados con esta materia
Competencias de la titulación que se trabajan (ver memoria título):
- Básicas: CB6, CB7, CB8, CB10
- Transversales/Generales: G1, G2, G4, T4, T7
- Específicas: E1, E2
Clases teóricas, en las que se expone el contenido de cada tema. El alumnado dispondrá de copias de las transparencias con anterioridad y el profesorado promoverá una actitud activa, realizando preguntas que permitan aclarar aspectos concretos y dejando cuestiones abiertas para la reflexión del alumnado.
Clases prácticas con uso de ordenador, que permiten al alumnado familiarizarse desde un punto de vista práctico con las cuestiones expuestas en las clases teóricas.
Actividades formativas de carácter presencial y su relación con las competencias de la titulación:
Clases teóricas: impartidas por el profesorado y exposición de seminarios: CB6, CB8, CB10, E1, E2
Clases prácticas de laboratorio, resolución de problemas y casos prácticos: CB7, CB8, CB10, E1, E2
Tutorías programadas: orientación para la realización de los trabajos individuales o en grupo, resolución de dudas y actividades de evaluación continua: CB6, CB7, CB8, CB10, G1, T4, G2, G4, T5, E1, E2
Examen: CB6, CB7, CB8, CB10, G1, T4, G2, G4, T5, E1, E2
Actividades formativas de carácter no presencial y su relación con las competencias de la titulación:
Trabajo personal del alumnado: consulta de bibliografía, estudio autónomo, desarrollo de actividades programadas, preparación de presentaciones y trabajos : E1, E2, CB6, CB7, CB8, CB10, G1, T4, G2, G4, T5
Realización de prácticas: 60%
Pruebas periódicas y/o examen final: 30%
Seguimiento continuado y objetivable de una participación activa: 10%
Para superar la materia es necesario que al menos un 10% de la nota total provenga de las Pruebas periódicas y/o examen final
La evaluación en la segunda oportunidad es exactamente igual que en la primera oportunidad (entrega de prácticas, realización de pruebas y seguimiento de participación activa).
Para los casos de realización fraudulenta de ejercicios o pruebas será de aplicación
lo recogido en la "Normativa de evaluación del rendimiento académico de los/as
estudiantes y de revisión de calificaciones"
Clases expositivas: 18 h + 33 h trabajo autonomo del alumnado
Clases interactivas: 13.5 h + 33 h trabajo autonomo del alumnado
Tutorias y Actividades de evaluacion: 4 h + 11 h trabajo autonomo del alumnado
Total: 112.5 h
Completar la formación obtenida en clase con la lectura de los correspondientes capítulos en los libros de referencia, realizar todos los ejercicios prácticos propuestos y familiarizarse con las plataformas y librerías utilizadas para la experimentación y desarrollo con sistemas de búsqueda y minería de texto.
Antonio Mosquera Gonzalez
- Department
- Electronics and Computing
- Area
- Languages and Computer Systems
- Phone
- 881813567
- antonio.mosquera [at] usc.es
- Category
- Professor: University Lecturer
David Enrique Losada Carril
Coordinador/a- Department
- Electronics and Computing
- Area
- Computer Science and Artificial Intelligence
- Phone
- 881816451
- david.losada [at] usc.es
- Category
- Professor: University Professor
Tuesday | |||
---|---|---|---|
16:00-17:15 | Grupo /CLE_01 | Spanish | PROJECTS |
01.08.2025 16:00-19:45 | Grupo /CLIL_01 | IA.01 |
01.08.2025 16:00-19:45 | Grupo /CLE_01 | IA.01 |
07.03.2025 16:00-19:45 | Grupo /CLE_01 | IA.01 |
07.03.2025 16:00-19:45 | Grupo /CLIL_01 | IA.01 |