Buenas, antes que todo agradecer cualquier ayuda o sugerencia.
Bueno les comento tengo un set de datos de 2300 filas y 13 columnas (Características) mis datos son alfanuméricos, y representan las fallas de un equipo, entre los datos tengo fecha, hora, código de falla, componente que fallan, mi idea es hacer un análisis descriptivo a través de reglas de asociaciones. Pero antes debo disminuir las dimensiones de mi set de datos PCA, y mi idea es hacerlo con sklearn el problema es que buscando por internet, aparecen distintas formas en algunos lados me aparece que debo dividir el set de datos, en otros lados esta linea pca = PCA(n_components=0.95) me aparece con 2 componentes a veces con 6 entonces mi pregunta es cual seria el numero indicado n_components y si debo ir probando ese numero de que forma valido el que sea el mas optimo.
Bueno eso seria por el momento y si tienen algún ejemplo para poder guiarme.
Saludos y gracias nuevamente.