Limpieza de datos (missing values, errores de tipeo)
Análisis exploratorio de datos (EDA con librería Pandas).
Visualización Estadística: Histogramas, Gráficos de Cajas, Plots de Dispersión.
Escalamiento y estandarización de datos.
Conjunto de testing y training.
Modelos supervisados (regresiones y sus métricas mean squared error, MAE)
Modelos de clasificación y sus métricas (matriz de confusión y curva ROC – AUC)
Análisis de componentes principales (PCA).
Modelos de ensamble (random Forest, XgBoost)
Selección de modelos en función de métricas (scores)
ORLANDO BELLI HESSE
Ingeniero Industrial, con experiencia en consultoría y desarrollo de proyectos de machine learning y Big Data Analytics en los sectores retail e industrial. Experiencia en operación y mantenimiento de industrias en los sectores energía, minas.