Ejercicios¶
Ejercicios entregables¶
UT1 Unidad 1 · EDA & Fuentes
🌸 Entre pétalos y datos: explorando el clásico dataset Iris
✅ CompletoExploración del clásico dataset Iris para clasificación supervisada. Análisis de medidas morfológicas, correlaciones y construcción de data dictionary.
Ver ejercicio📝 Creación del Portfolio
✅ CompletoDesarrollo y configuración del portafolio académico para documentar el aprendizaje durante el curso.
Ver ejercicio🎬 Explorando Netflix: descubriendo los patrones detrás de tus series y películas favoritas
✅ CompletoAnálisis exploratorio de datos del dataset de Netflix. Exploración de contenido, géneros, ratings y tendencias temporales.
Ver ejercicio🚕 Integración de múltiples fuentes para analizar el sistema de taxis en NYC
✅ CompletoAnálisis exploratorio de datos de taxis de Nueva York. Exploración de viajes, tarifas, ubicaciones y patrones temporales.
Ver ejercicioUT2 Unidad 2 · Calidad & Ética
🏠 Análisis de calidad de datos e imputación en Ames Housing
✅ CompletoAnálisis de calidad de datos e imputación en Ames Housing. Clasificación de tipos de missing data (MCAR, MAR, MNAR) y estrategias de imputación.
Ver ejercicio🏠 Feature Scaling y Leakage en Ames Housing
✅ CompletoFeature scaling, detección de outliers y prevención de data leakage. Comparación de scalers y construcción de pipelines reproducibles.
Ver ejercicio🚢 Detección y mitigación de sesgo con Fairlearn
✅ CompletoDetección y análisis de sesgos en datasets. Identificación de sesgos en modelos predictivos y evaluación de impacto.
Ver ejercicioUT3 Unidad 3 · Feature Engineering
🏠 Construyendo valor con datos: Feature Engineering para predecir precios de viviendas
✅ CompletoTécnicas avanzadas de feature engineering. Creación de features derivadas, transformaciones y selección de características.
Ver ejercicio💵 Target Encoding sobre sueldo de Adultos
✅ CompletoTécnicas avanzadas de encoding para variables categóricas. Comparación de métodos y evaluación de impacto en modelos.
Ver ejercicio🔍 PCA y Feature Selection: Optimizando modelos de precios inmobiliarios
✅ CompletoTécnicas de reducción de dimensionalidad y selección de variables. Aplicación de PCA, métodos Filter, Wrapper y Embedded para optimizar modelos de precios inmobiliarios.
Ver ejercicio⏰ Temporal Features: Extracción y Análisis de Variables Temporales
✅ CompletoAnálisis temporal de comportamiento de usuarios y creación de features derivadas. Exploración de patrones temporales en transacciones y creación de variables que representen frecuencia, recurrencia y hábitos de usuarios.
Ver ejercicioUT4 Unidad 4 · Datos No Estructurados
🗺️ Análisis geoespacial con GeoPandas: proyecciones, coropletas y cobertura SUBTE
✅ CompletoAnálisis geoespacial de Buenos Aires con GeoPandas. Proyecciones cartográficas, mapas coropléticos, indicadores per cápita y análisis de cobertura del transporte público.
Ver ejercicio🖼️ Preprocesamiento de Imágenes para Machine Learning
✅ CompletoTécnicas de preprocesamiento de imágenes. Normalización, redimensionamiento, augmentación y preparación de datos para modelos de visión por computadora.
Ver ejercicio🎵 Audio como Datos: Extracción de Features y Análisis
✅ CompletoProcesamiento y análisis de datos de audio. Extracción de características, espectrogramas, MFCCs y preparación de features para clasificación de sonido.
Ver ejercicioUT5 Unidad 5 · Cloud & Pipelines
🔓☁️ Google Cloud Desbloqueado: Hands-on Labs
✅ CompletoIntroducción a Google Cloud Platform. Cloud Console, proyectos, IAM, habilitación de APIs y estructura de labs en Google Cloud Skills Boost.
Ver ejercicio📊⚙️ Pipeline de Transformación de Datos con Cloud Dataprep
✅ CompletoPreparación y enriquecimiento de datos con Cloud Dataprep. Pipeline BigQuery → Dataprep → Dataflow → BigQuery para limpieza y transformación visual de datos.
Ver ejercicio🔄 Orquestando pipelines de datos: del código al flujo con Prefect
✅ CompletoDiseño e implementación de pipelines ETL con Prefect. Tasks, Flows, DAGs implícitos, retries, caching, validación de datos y principios de DataOps.
Ver ejercicioEjercicios adicionales¶
Extra Ejercicios Adicionales
💳 Detección de Fraude en Tarjeta de Crédito
✅ CompletoAnálisis y detección de transacciones fraudulentas en tarjetas de crédito. Aplicación de técnicas de machine learning para clasificación de fraude.
Ver ejercicio📊 Dashboard Interactivo con Streamlit
✅ CompletoDesarrollo de dashboards interactivos con Streamlit. Filtros dinámicos, visualizaciones con Plotly, métricas en tiempo real y despliegue de aplicaciones web de datos.
Ver ejercicio🕷️ Web Scraping de Datos con Python
✅ CompletoExtracción de datos de sitios web con BeautifulSoup y requests. Parsing de HTML, manejo de paginación, tablas y buenas prácticas de scraping ético.
Ver ejercicio