Créditos ECTS Créditos ECTS: 3
Horas ECTS Criterios/Memorias Horas de Tutorías: 1 Clase Expositiva: 10 Clase Interactiva: 11 Total: 22
Lenguas de uso Inglés
Tipo: Materia Ordinaria Máster RD 1393/2007 - 822/2021
Departamentos: Electrónica y Computación, Departamento externo vinculado a las titulaciones
Áreas: Lenguajes y Sistemas Informáticos, Área externa M.U en Intelixencia Artificial
Centro Escuela Técnica Superior de Ingeniería
Convocatoria: Primer semestre
Docencia: Con docencia
Matrícula: Matriculable | 1ro curso (Si)
El objetivo de la materia es la introducción de los aspectos básicos de la ingeniería de datos, fundamentalmente en el ámbito del Big Data. Las competencias adquiridas permitirán el análisis y la gestión eficiente de información heterogénea, tanto estructurada como no estructurada, dentro del desarrollo de aplicaciones IA, allí donde los métodos tradicionales muestren su insuficiencia.
- Conceptos y fundamentos de la ingeniería de datos: Conceptos y definiciones básicas, problemas de carga eficiente en escenarios Big Data, almacenamiento de datos masivos y acceso a los mismos.
- Técnicas de limpieza y preparación de datos: Técnicas más comunes, definición de flujos de procesamiento, métricas de calidad.
- Estructuras avanzadas y almacenes de datos eficientes para el Big Data: Data Warehouse y BD multidimensionales, Data Lakes, Bases de datos NoSQL.
Bibliografía Básica
Sadalage, Fowler. NoSQL Distilled: A Brief Guide to the Emerging World of Polyglot Persistence, Addison-Wesley, 2012.
Avi Silberschatz, Henry F. Korth, S. Sudarshan, Database System Concepts, Sixth edition, McGraw-Hill, 2010. ISBN 0-07-352332-1
Ihab F. Ilyas and Xu Chu. 2019. Data Cleaning. Association for Computing Machinery, New York, NY, USA.
Alex Gorelik, The Enterprise Big Data Lake: Delivering the Promise of Big Data and Data Science, O’ Reilly Media, Inc., 2019. ISBN: 9781491931554.
Matt Casters, Roland Bouman, Jos van Dongen,, Pentaho Kettle Solutions: Building Open Source ETL Solutions with Pentaho Data Integration, 978-0470635179, Wiley, 2013.
Las competencias de la titulación que se trabajan en esta materia (ver la memoria de la titulación) son las siguientes:
Competencias básicas y generales: CG2, CG3, CG4, CG5, CB6, CB7, CB8.
Competencias transversales: CT3, CT7, CT8, CT9.
Competencias específicas: CE16.
Más en concreto el alumno será capaz de:
- Desarrollar la capacidad de analizar y modelar datos para su procesado en sistemas
inteligentes.
- Conocer y comprender el proceso de extracción, limpieza, transformación, carga y
preprocesado de datos
- Conocer y saber utilizar bases de datos multidimensionales y de tipo NoSQL
- Conocer los fundamentos de data lakes y data warehouses
La metodología de esta materia estará basada en la combinación de tres tipos de actividades presenciales con trabajo autónomo del alumnado.
Lección magistral: El profesorado presenta un tema al alumnado con el objetivo de facilitar un conjunto de información con alcance concreto. Esta metodología docente se aplicará a la actividad formativa "Clases de teoría"
Prácticas de laboratorio: El profesorado de la materia plantea al alumnado un problema o problemas de carácter práctico cuya resolución requiere la comprensión y aplicación de los contenidos teórico-prácticos incluidos en los contenidos de la materia.
El alumnado puede trabajar la solución a los problemas planteados de forma individual o en grupos. Esta metodología docente se aplicará a la actividad formativa "Clases prácticas de laboratorio" y se podrá aplicar a la actividad formativa de "Sesiones de aprendizaje basado en problemas, seminarios, estudio de casos y proyectos".
Condiciones aplicadas a las dos oportunidades de Junio y Julio.
Prácticas de laboratorio (60%): Entrega de prácticas de laboratorio planteadas a lo largo del curso en las fechas estipuladas previamente. Para la liberación de esta parte de la asignatura el estudiante deberá obtener una calificación igual o superior a
5 puntos (sobre 10).
Examen de preguntas de desarrollo (40%): El examen abarca todos los temas del curso. Los alumnos deben desarrollar, relacionar, organizar y presentar los conocimientos que poseen sobre cada tema dado en una respuesta razonada y bien articulada. Para la liberación de esta parte de la asignatura el estudiante deberá obtener una calificación igual o superior a
5 puntos (sobre 10).
Para superar la asignatura en cualquier convocatoria, la calificación final debe ser igual o superior a 5, debiéndose obtener como mínimo un 5 (sobre 10) en cada una de las partes.
12 horas presenciales de clases de teoría. 12 horas presenciales de clases de laboratorio y aprendizaje basado en proyectos. 50 horas de trabajo personal no presencial del alumnado.
Seguir la metodología propuesta, asistiendo a las clases, dedicando el tiempo necesario al estudio y a la realización de trabajos y resolviendo problemas específicos con la ayuda del profesorado en las sesiones de tutorías.
Se hará uso del campus virtual, para mejorar la comunicación entre el alumnado y el profesorado, para alojar el material necesario y para apoyar en los procesos de evaluación.
Pedro Celard Perez
Coordinador/a- Departamento
- Electrónica y Computación
- Área
- Lenguajes y Sistemas Informáticos
- Correo electrónico
- pedro.celard [at] usc.es
- Categoría
- Profesor/a: Ayudante Doutor LOSU
Lunes | |||
---|---|---|---|
15:30-17:00 | Grupo /CLE_01 | Inglés | IA.02 |
Miércoles | |||
15:30-17:00 | Grupo /CLIL_01 | Inglés | IA.02 |
17.12.2024 16:00-20:00 | Grupo /CLIL_01 | IA.02 |
17.12.2024 16:00-20:00 | Grupo /CLE_01 | IA.02 |
18.06.2025 16:00-20:00 | Grupo /CLE_01 | IA.02 |
18.06.2025 16:00-20:00 | Grupo /CLIL_01 | IA.02 |