16 votos

Desigual tamaño de la muestra: Cuando para dejarlo

Estoy por pares la revisión de una revista académica artículo y los autores escribió lo siguiente como justificación para no denunciar cualquier estadística inferencial (yo no identificativos) la naturaleza de los dos grupos):

En total, 25 de la 2,349 (1.1%) de los encuestados informó de X. Hemos utilizado el estribillo de la presentación de los análisis que comparan estadísticamente grupo X grupo Y (el otro 2,324 participantes) ya que los resultados podrían ser fuertemente impulsado por casualidad con un resultado de esta rara.

Mi pregunta es, son los autores de este estudio se justifica en tirar la toalla con respecto a la comparación de los grupos? Si no, ¿qué podría recomendar a ellos?

26voto

Sean Hanley Puntos 2428

Las pruebas estadísticas no hacer suposiciones acerca del tamaño de la muestra. Hay, por supuesto, las diferentes hipótesis con varias pruebas (por ejemplo, la normalidad), pero la igualdad de los tamaños de muestra no es uno de ellos. A menos que la prueba utilizada es inadecuada de alguna otra manera (no puedo pensar en un problema ahora mismo), el tipo de la tasa de error no serán afectados por drásticamente la desigualdad de los tamaños de los grupos. Además, su redacción implica (a mi parecer) que ellos creen que es. Por lo tanto, ellos están confundidos acerca de estos temas.

Por otro lado, las tasas de error de tipo II mucho va a ser afectados por la muy desigual, $n$s. Esto será cierto, no importa lo que la prueba (por ejemplo, el $t$-prueba de u de Mann-Whitney $U$-prueba, o $z$-prueba para la igualdad de proporciones va a afectar a todos en este modo). Para un ejemplo de esto, véase mi respuesta a esta pregunta: ¿Cómo se debe interpretar la comparación de medias de los diferentes tamaños de muestra? Por lo tanto, bien pueden ser "justificados en tirar la toalla" con respecto a este tema. Concretamente, si se espera obtener un no-significativas del resultado si el efecto es real o no, ¿cuál es el punto de la prueba?)

Como el tamaño de la muestra difieren, el poder estadístico convergerán a $\alpha$. Este hecho provoca una sugerencia distinta, que creo que pocas personas han oído hablar alguna vez de y probablemente tendría problemas para conseguir más allá de los revisores (sin ánimo de ofender intención): un compromiso el análisis del poder. La idea es relativamente sencilla: En cualquier análisis del poder de las, $\alpha$, $\beta$, $n_1$, $n_2$, y el tamaño del efecto $d$, existe en relación a otros. Habiendo especificado todos, excepto uno, se puede resolver para la última. Normalmente, la gente hacer lo que se llama un a-priori del análisis del poder, en el que resolver para $N$ (en general, usted está asumiendo $n_1=n_2$). Por otro lado, se puede arreglar $n_1$, $n_2$, y $d$, y resolver para $\alpha$ (o, equivalentemente,$\beta$), si se especifica la relación de tipo I error tipo II tarifas que están dispuestos a vivir con. Convencionalmente, $\alpha=.05$$\beta=.20$, por lo que usted está diciendo que los errores de tipo I son cuatro veces peor que los errores de tipo I. Por supuesto, un investigador puede estar en desacuerdo con eso, pero después de haber especificado una proporción dada, se puede resolver para lo $\alpha$ que se debe utilizar con el fin de, posiblemente, mantener algunas de alimentación adecuada. Este enfoque es lógicamente válida opción para los investigadores en esta situación, aunque reconozco el exotismo de este enfoque puede hacer que sea difícil de vender en la más grande comunidad de investigación que probablemente nunca ha oído hablar de tal cosa.

6voto

unk2 Puntos 36

Mientras que la respuesta de @gung es excelente, creo que hay una cuestión importante que debe ser considerado cuando se mira en salvajemente diferentes tamaños de grupo. En general, mientras todos los requisito de la prueba de que se cumpliera la diferencia en los tamaños de los grupos no es importante.

Sin embargo, en algunos casos, el tamaño de grupo diferente tendrá un efecto dramático en la robustez de la prueba en contra de las violaciones en contra de estas hipótesis. El clásico de dos muestras no apareadas de la prueba t para el ejemplo se asume que la varianza homongenity y es robusto frente a las violaciones sólo si ambos grupos son al igual tamaño (en orden de magnitud). De lo contrario, mayor varianza en el grupo más pequeño los conducirá a errores de Tipo I. Ahora con la prueba de t esto no es mucho de un problema, ya que comúnmente la Welch t-test se utiliza en su lugar y no asume la varianza homogeinidad. Sin embargo, los efectos similares pueden surgir en modelos lineales.

En resumen, yo diría que esto no es de ninguna manera un obstáculo para un análisis estadístico, pero ha de tenerse en cuenta a la hora de decidir cómo proceder.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X