CoverPost
06 - 15 - 2023
Ciencia de Datos

Modelos lineales básicos (regresión lineal y logística), técnicas de regularización (Lasso L1, Ridge L2, Red Elástica), equilibrio sesgo-varianza, conceptos de overfitting y underfitting, validación cruzada, con implementaciones prácticas en Python y fundamentos teóricos completos para machine learning.

2185 Words | 11 Minutes
CoverPost
06 - 10 - 2023
Ciencia de Datos

Métricas fundamentales para evaluación de modelos de clasificación, incluyendo matriz de confusión (TP, TN, FP, FN), accuracy, precision, recall, F1-Score, especificidad, curva ROC-AUC, manejo de datasets desbalanceados, optimización de thresholds, y implementación práctica con ejemplos de código completos.

1155 Words | 6 Minutes
CoverPost
06 - 08 - 2023
Ciencia de Datos

Aprendizaje supervisado, definiciones, características, jerarquía desde Inteligencia Artificial hasta Deep Learning, tipos de problemas (clasificación vs regresión), metodología de división temporal de datos, algoritmos fundamentales, métricas de evaluación y aplicaciones prácticas con ejemplos de código.

1499 Words | 7 Minutes
CoverPost
04 - 29 - 2023
Ciencia de Datos

OLTP vs OLAP, Data Warehouse, proceso ETL (Extract, Transform, Load), Tabla Analítica de Datos (TAD), reducción de dimensionalidad con PCA, selección de características, series de tiempo con análisis de acciones Apple, analogía de cocina para machine learning, y plantillas de código completas con fundamentos teóricos y aplicaciones prácticas.

1332 Words | 7 Minutes
CoverPost
04 - 26 - 2023
Ciencia de Datos

Guía exhaustiva sobre valores ausentes e imputación de datos, cubriendo tipos de ausencia (MCAR, MAR, MNAR), métodos de imputación para variables continuas y categóricas, reglas de negocio, evaluación de porcentajes de missings, principios fundamentales y técnicas avanzadas con ejemplos prácticos en Python y scikit-learn.

1579 Words | 8 Minutes
CoverPost
04 - 19 - 2023
Ciencia de Datos

Principio "Garbage In, Garbage Out", dimensiones de calidad (completitud, consistencia, precisión, validez, unicidad, oportunidad), procesos de limpieza de datos, tratamiento de valores ausentes y outliers, normalización de variables categóricas, escalamiento de datos con fundamentos teóricos completos y aplicaciones prácticas en Python.

2047 Words | 10 Minutes