Créditos ECTS Créditos ECTS: 6
Horas ECTS Criterios/Memorias Horas de Tutorías: 1 Clase Expositiva: 21 Clase Interactiva: 21 Total: 43
Lenguas de uso Inglés
Tipo: Materia Ordinaria Máster RD 1393/2007 - 822/2021
Departamentos: Electrónica y Computación, Departamento externo vinculado a las titulaciones
Áreas: Arquitectura y Tecnología de Ordenadores, Área externa M.U en Intelixencia Artificial
Centro Escuela Técnica Superior de Ingeniería
Convocatoria: Primer semestre
Docencia: Con docencia
Matrícula: Matriculable
La cada vez mayor cantidad de información accesible a través de Internet hace que el procesamiento eficiente de grandes cantidades de datos sea cada vez de mayor interés. Esto ha llevado al desarrollo de nuevas técnicas de almacenamiento y procesamiento de ingentes cantidades de información, técnicas que se adaptan de forma natural a los sistemas distribuidos.
El objetivo principal de esta materia es proporcionar a los estudiantes los conocimientos y habilidades necesarios para comprender, desarrollar y aplicar técnicas de inteligencia artificial (IA) en entornos de Big Data.
1. Introducción al Big Data
a) Que es Big Data
b) Aplicaciones Big Data
c) Analítica Big Data
d) Problemática del análisis de datos en entornos Big Data
2. Preparación y visualización de datos
a) Técnicas de preprocesado de datos
b) Técnicas de visualización
3. Aprendizaje federado
a) Aprendizaje en el borde
b) Preservación de la privacidad
4. Infraestructuras para el almacenamiento y procesamiento de Big Data
a) Paralelismo y sistemas distribuidos
b) Computación de Altas Prestaciones versus Computación Big Data
c) Apache Hadoop y MapReduce
5. Procesamiento de datos a gran escala: Apache Spark
a) Procesamiento en lote y procesamiento continuo.
b) Arquitectura
c) Spark Core (RDDs) y Spark SQL, DataSets & DataFrames
d) Spark DataFrames
6. Aprendizaje automático con Apache Spark
a) El flujo de trabajo en aprendizaje automático
b) Aprendizaje automático supervisado y no supervisado
c) Ajuste de hiperparámetros, evaluación y pipelines
Bibliografía básica
- Apuntes proporcionados por el profesorado
- A. Polak, Scaling Machine Learning with Spark, O'Reilly, 2023
- I. Triguero, M. Galar, Large-Scale Data Analytics with Python and Spark, Cambridge University Press, 2023
Bibliografía complementaria
- T. White, Hadoop: The Definitive Guide, 4th Edition, O'Reilly, 2015
- J. Damji, B. Wenig, T. Das and D. Lee. Learning Spark, 2nd Edition, O'Reilly, 2020
Como resultado del aprendizaje el alumnado que curse esta materia podrá:
- Conocer las técnicas que permiten el diseño de técnicas de IA escalables a nivel software y de recursos hardware
- Adquirir las competencias que permitan integran gran volumen y variedad de datos en proyectos de Big Data en IA
- Conocer los paradigmas de escalabilidad en algoritmos de aprendizaje automático
- Comprender, analizar y diseñar las infraestructuras necesarias para proyectos de IA en BigData: entorno local/nube y equipamiento físico/virtual con sistemas de almacenamiento de baja latencia y sistemas de ficheros distribuidos.
- Conocer los lenguajes, frameworks y componentes que nos permiten incrementar el rendimiento en las infraestructuras hardware con CPU y GPU.
- Conocer las técnicas que permiten, con baja latencia, la visualización de datos en entornos con gran volumen de información.
- Usar y poder aplicar los KPI correctos en cada entorno.
Competencias de la titulación que se trabajan (ver memoria título):
- Básicas y generales: CB6, CB7, CB8, CG2, CG3, CG4, CG5.
- Transversales: CT3, CT7, CT8, CT9.
- Específicas: CE10, CE11, CE12, CE13, CE14, CE15.
Las clases serán presenciales y se retransmitirán de forma síncrona a los demás campus.
- Clases de teoría, en las que se expone el contenido de cada tema. El alumno dispondrá de copias de las transparencias con anterioridad y el profesor promoverá una actitud activa, realizando preguntas que permitan aclarar aspectos concretos y dejando cuestiones abiertas para la reflexión del alumno.
- Clases prácticas en el aula de informática, que permiten al alumno familiarizarse desde un punto de vista práctico con las cuestiones expuestas en las clases teóricas.
- Aprendizaje basado en problemas, seminarios, estudio de casos o proyectos, que permiten que el alumnado adquiera determinadas competencias en base a la resolución de ejercicios, estudio de casos y realización de proyectos.
Actividades formativas de carácter presencial y su relación con las competencias de la titulación
- Clases de teoría: impartidas por el profesor y exposición de seminarios. Competencias trabajadas: CG2, CB6, CE10, CT3, CE11, CE12, CE13, CE14, CE15
- Clases prácticas de laboratorio y aprendizaje basado en problemas. Competencias trabajadas: CG2, CG5, CB7, CT7, CT8, CT9
- Tutorías programadas: orientación para la realización de los trabajos individuales o en grupo, resolución de dudas y actividades de evaluación continua. Competencias trabajadas: T1.
Actividades formativas de carácter no presencial y su relación con las competencias de la titulación:
- Trabajo personal del alumno: consulta de bibliografía, estudio autónomo, desarrollo de actividades programadas, preparación de presentaciones y trabajos. Competencias trabajadas: CG2, CG3, CG4, CG5, CT3, CT7, CT8, CT9
Todo el material formativo e informativo esencial y suplementario estará disponible en el Microsoft Teams de la UDC.
- Evaluación de trabajos prácticos: 50% de la nota. Se evaluarán las soluciones propuestas por el alumnado en las prácticas planteadas. La evaluación de prácticas puede llevarse a cabo mediante una corrección por parte del profesor, una defensa de la solución aportada por parte del alumno ante el profesor o una presentación oral de la solución desarrollada. Todos los trabajos deberán ser entregados antes de las fechas que se especificarán y deberán cumplir unos requisitos mínimos de calidad para ser tenidos en consideración. Se valorará el grado de cumplimiento de las especificaciones, la metodología y rigurosidad y la presentación de resultados. En esta parte se evaluarán implícita o explícitamente las competencias CG2, CG3, CG4, CG5, CB6, CB7, CB8, CT3, CT7, CT8, CT9, CE10, CE11, CE12, CE13, CE14, CE15.
- Evaluación de trabajos teóricos: 5% de la nota. Se evaluará la realización de proyectos de aprendizaje colaborativo, donde el alumnado hará trabajos (preferiblemente en parejas o grupos) para desarrollar en detalle un artículo científico relacionado con los temas vistos en teoría, y lo presentará para toda la clase, donde se podrán hacer preguntas. Estos proyectos podrán hacerse en las horas de enseñanza no presencial y su objetivo es profundizar en los contenidos de la materia, así como adquirir competencias de análisis crítico, resumen, y presentación oral. Se valorará el grado de cumplimiento de las especificaciones, la metodología y rigurosidad y la presentación de resultados. En esta parte se evaluarán implícita o explícitamente las competencias CG2, CG3, CG4, CG5, CB1, CB3, CT3, CT4, CT4, CT7, CT8, CT9, CE11, CE15.
- Examen final: 45% de la nota. En esta parte se evaluarán implícita o explícitamente las competencias CG2, CB6, CB7, CB8, CT9, CE10, CE11, CE12, CE13, CE14, CE15.
Para superar la materia, debe conseguirse una puntuación total de 5 o superior. Es imprescindible para aprobar haber entregado en plazo todas las prácticas indicadas cómo obligatorias. Las entregas fuera de plazo no serán evaluadas.
Condición para cualificación de No Presentado: no presentar ninguna práctica y no asistir al examen final.
Los alumnos que no sean de nueva matrícula no conservan notas de cursos anteriores.
Oportunidad de recuperación (julio) y extraordinaria:
La valoración será igual que en la oportunidad ordinaria. Los alumnos que no entregaron los trabajos propuestos a lo largo del cuatrimestre los deberán entregar antes de la fecha establecida.
Condición para cualificación de No Presentado: no presentar ninguna práctica y no asistir al examen final.
En el caso de realización fraudulenta de ejercicios o pruebas, será de aplicación lo recogido en la Normativa de avaliación do rendemento académico dos estudantes e de revisión de cualificacións.
En aplicación de la Normativa da ETSE sobre plaxio (aprobada por la Xunta de la ETSE el 19/12/2019), la copia total o parcial de algún ejercicio de prácticas o de teoría supondrá el suspenso en las dos oportunidades del curso, con la calificación de 0,0 en ambos casos.
- Clases de teoría: 21 horas presenciales, 42 horas en total de dedicación.
- Clases prácticas de laboratorio: 14 horas presenciales, 60 horas en total de dedicación.
- Aprendizaje basado en problemas, seminarios, estudio de casos y proyectos: 7 horas presenciales, 48 horas en total de dedicación.
Total: 150 h
Debido a la fuerte interrelación entre la parte teórica y la parte práctica, y a la progresividad en la presentación de conceptos muy relacionados entre sí en la parte teórica, es recomendable dedicar un tiempo de estudio o repaso diario.
Se hará uso intensivo de herramientas de comunicación en línea: videoconferencia, chat, etc.
Las clases serán impartidas en inglés. Tanto el material de clase como la bibliografía se encuentran íntegramente en inglés.
Alvaro Ordoñez Iglesias
Coordinador/a- Departamento
- Electrónica y Computación
- Área
- Arquitectura y Tecnología de Ordenadores
- Teléfono
- 881815508
- Correo electrónico
- alvaro.ordonez [at] usc.es
- Categoría
- Profesor/a: Profesor Ayudante Doctor LOU
Lunes | |||
---|---|---|---|
17:00-18:30 | Grupo /CLE_01 | Inglés | IA.12 |
18:30-20:00 | Grupo /CLIL_01 | Inglés | IA.12 |
10.01.2025 10:30-14:00 | Grupo /CLIL_01 | IA.12 |
10.01.2025 10:30-14:00 | Grupo /CLE_01 | IA.12 |
17.06.2025 10:30-14:00 | Grupo /CLE_01 | IA.12 |
17.06.2025 10:30-14:00 | Grupo /CLIL_01 | IA.12 |