Uno de los problemas al que generalmente nos enfrentamos al entrenar modelos de Machine Learning, es la alta dimensionalidad de los "features" (ie. una gran cantidad de variables por cada feature). Para resolver este problema debemos ser capaces de reducir la dimensionalidad de los features conservando un alto porcentaje de las características principales, lo cual se puede hacer mediante un análisis PCA.
El análisis PCA permite "proyectar" los features hacia un espacio de menor dimensión (el espacio de las componentes principales) que maximiza la varianza, en otras palabras, podemos explicar un alto porcentaje de la información original usando "pocas" variables.
Un análisis PCA previo al entrenamiento de algún modelo de ML puede ayudar a acelerar los procesos de entrenamiento.
En el presente repositorio muestro algunos ejemplos que describen el proceso convencional del análisis PCA.