Quiero reducir la dimensionalidad de orden superior y sistemas de captura de la mayoría de la covarianza en un preferiblemente de 2 dimensiones o 1 dimensiones de campo. Entiendo que esto puede ser realizado a través del análisis de componentes principales, y he utilizado PCA en muchos escenarios. Sin embargo, nunca lo he usado con tipos de datos boolean, y me preguntaba si es significativo para hacer PCA con este conjunto. Así, por ejemplo, pretender que yo cualitativos o descriptivos de la métrica, y le asigna un "1", si la métrica es válido para esa dimensión, y un "0" si no lo está (datos binarios). Así por ejemplo, imagine que usted está tratando de comparar a los Siete Enanitos de Blanca nieves. Tenemos:
Doc, Tonto, Tímido, de mal humor, Estornudos, Sueño y Feliz, y desea organizar ellos basados en cualidades, y lo hizo como es:
$$\begin{pmatrix} & Lactose\ Intolerant & A \ Honor\ Roll & Athletic & Wealthy \\ Doc & 1 & 0 & 1 & 1 \\ Dopey & 0 & 0 & 0 & 0 \\ Bashful & 1 & 0 & 1 & 1 \\ Grumpy & 1 & 1 & 1 & 1 \\ Sneezy & 0 & 1 & 1 & 0 \\ Sleepy & 1 & 0 & 0 & 0 \\ Happy & 1 & 1 & 0 & 0 \end{pmatrix}$$
Así, por ejemplo Vergonzoso es intolerante a la lactosa y no en Un lugar de honor. Esto es puramente hipotética de la matriz, y mi verdadera matriz tendrá muchas más descriptivo columnas. Mi pregunta es, ¿seguiría siendo apropiado para hacer PCA en esta matriz como un medio para encontrar la similitud entre los individuos?