¿Recuerdas que en muchas aplicaciones tratamos de analizar patrones y agruparlos? Bueno, en este curso aprenderás algunas técnicas que intentan reproducir la capacidad del ser humano de identificar similitudes y separarlas en grupo. El clustering es una de estas técnicas y sirven para segmentar datos en grupos iguales o similares sobre con base a ciertas características. Al finalizar el curso, serás capaz de entender la importancia de manejar la información y de explorar por ti mismo distintas bases de datos. Este curso es fundamental en un/a profesional con habilidades básicas de un científico de datos o Data Scientist.
El objetivo de este curso es presentar la amplia gama de técnicas en aprendizaje no supervisado para datos mixtos.
Contenido
- Análisis Exploratorio de Datos mixtos.
- Medidas de disimilaridad para datos. mixtos.
- Técnicas de reducción de dimensionalidad para datos mixtos:
- FAMD
- PCA Mix
- Técnicas de reducción de dimensionalidad avanzadas:
- RPCA
- t-SNE
- Técnicas de clustering para datos mixtos:
- K-Prototypes
- Técnicas con distancias alternativas
- Técnicas de clustering avanzadas:
- DBSCAN
- Clustering Difuso
- Métodos de evaluación de calidad del cluster