9 votos

Dimensión de las técnicas de reducción de muy pequeño tamaño de la muestra

Tengo 21 socio-económico y de actitud a nivel macro variables (tales como el porcentaje de madres de edad 24-54 no empleados, el porcentaje de niños entre 3 y 5 años en las escuelas infantiles y así sucesivamente). También tengo datos sobre las proporciones de los abuelos que siempre intensivo de cuidado de niños. La mayoría de las variables socioeconómicas que he seleccionado son altamente correlacionados con servicios de guardería (por ejemplo, existe una correlación negativa entre la proporción de madres empleadas a tiempo parcial y con prestación de grandparental cuidado de los niños).

Idealmente, me gustaría crear una tipología de los diferentes tipos de países. Mi esperanza sería el uso de algún tipo de dimensión técnica de reducción de cuyos componentes o factores tendría sentido intuitivo (por ejemplo, las actitudes hacia la familia y el género, mercado de trabajo, la estructura, las políticas para la familia). O, alternativamente, evaluar cuál de las 21 macro-indicadores de nivel de mejor explican la variabilidad en los servicios de guardería infantil a través de los países.

Mi principal problema es que solo tengo 12 países Europeos. Creo que la PCA y el factor de análisis no son las técnicas apropiadas con tan pocos casos. Estoy en lo cierto? Me dijeron que trate de usar cualitativa análisis comparativo o el análisis de correspondencias múltiple, aunque, a mi entender, las últimas técnicas son más adecuadas para los binarios (o categóricas) macro-indicadores de nivel (considerando que los míos son los porcentajes o las variables continuas).

6voto

JMW.APRN Puntos 21

Me gustaría ir de co-inercia de análisis, que es un entendimiento de la variante de análisis canónico. Esto le daría una combinación lineal de las 21 variables que tiene el más alto de co-inercia con una combinación lineal de cuidado de niños de datos (o de cuidado de niños si es una variable cuantitativa). El truco de trabajar con co-inercia en lugar de correlación es que todavía puede realizar los cálculos cuando hay más variables que observaciones.

Por desgracia, la CIA no es muy amplia. Fue desarrollado por la ecología, donde por lo general hay más variables que los sitios de observación. Usted puede encontrar un poco de información técnica en Dray, Chessel y Thioulouse, Ecología 84(11), 3078-89, 2003.

Dicho esto, los otros comentarios/respuestas están a la derecha que el 12 es un número relativamente pequeño y tendrás que vivir con eso...

5voto

mat_geek Puntos 1367

Como Peter Ellis comentario/respuesta sugiere que usted está hablando acerca de la reducción de dimensionalidad y no de reducción de datos. Ha cambiado el número de puntos de datos el tamaño del espacio de las covariables. Ahora Pedro Flom, es correcto que el PCA y FA métodos puede ser tratado con tamaños de muestra pequeños, pero no es sólo las correlaciones que son propensos a ser mal estimado, pero también de que usted podría ser engañado en caer demasiado bajo dimensiones debido a las características que pueden aparecer más altamente correlacionada de lo que hubieran llegar a ser con una muestra más grande. Yo no lo recomendaría.

2voto

Greg Puntos 7391

Regularización de análisis factorial exploratorio fue diseñado con este problema en mente. Los autores han Matlab código disponible.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X