10 votos

SD mayor que la media, escala no negativa

Me dieron un artículo sobre un estudio muy similar a uno de mis laboratorio desea ejecutar. Pero, me di cuenta de que para la variable de interés, la Duración, la SDs son más grandes que la media...ya que este es la duración se mide en minutos que nunca puede ser negativa y esto me parece muy extraño para mí. Esto ocurrió en 2 de los estudios informó, a continuación es uno de ellos.

Más allá de eso, es una mezcla de diseño. Control v Tratamiento (entre grupos), y Tiempo1,Momento2,Time3 (repetición de medidas). Aquí están los medios (SDs), N >200

                       Time1                Time2                  Time3 
Control               15.1 (14.6)          14.4 (14.8)            13.3 (15.7)
Treatment             14.8 (13.2)          10.0 (12.2)            8.2 (9.9)

...que ellos se corrió un análisis de VARIANZA y reportó una p<.001.

Me pidió que lo utilice como base para un análisis para determinar el tamaño de la muestra para nuestro estudio. Estoy bastante seguro de que esto indica que los datos no es normal o tiene valores atípicos y no me siento cómodo determinar el tamaño de la muestra se basa en esto. Solo estoy fuera de base?

5voto

AdamSane Puntos 1825

Es fácilmente posible para la desviación estándar para superar la media, con la no-negativo o estrictamente positivo de datos

Me gustaría describir como la desviación estándar de estar cerca de la media (no cada valor es mayor y los que son más grandes son generalmente cerca). Para los no-negativa de datos, lo hace bastante claramente indican que los datos son de sesgo (por ejemplo, la distribución gamma con el coeficiente de variación =1 sería la distribución exponencial, por lo que si los datos fueron gamma, que vería en algún lugar cerca de la exponencial)

Sin embargo, con ese tipo de tamaño de la muestra, el análisis de VARIANZA no puede ser afectado en especial por que; la incertidumbre en la estimación de la varianza agrupada va a ser bastante pequeña, así que podríamos considerar que entre la CLT (por los medios) y del teorema de Slutsky (para la varianza de la estimación en el denominador), un ANOVA probablemente funcione razonablemente bien, ya que tendrás un asintótica chi-cuadrado, para que el ANOVA-F con su gran denominador grados de libertad será una buena aproximación.

Dicho esto, si su estudio tienen un menor tamaño de la muestra, que puede ser mejor buscando en el uso de una prueba diferente (tal vez una prueba de permutación, o uno más adecuado para los datos asimétricos tal vez basada en un GLM). El cambio en la prueba puede requerir un poco más grande del tamaño de la muestra que se obtendría para una escalera de ANOVA.

Con los datos originales se podría hacer un análisis del poder en virtud de un adecuado modelo de análisis. Incluso en la ausencia de los datos originales, uno podría hacer más plausible la hipótesis acerca de la distribución (tal vez una gran variedad de ellos) e investigar toda la curva de potencia (o, más simplemente, el tipo de la tasa de error y el poder en cualquiera que sea el tamaño del efecto es de interés). Una variedad de suposiciones razonables podrían ser utilizados, lo que da una idea de lo poderoso que puede ser alcanzado bajo plausible circunstancias, y cuánto más grande que el tamaño de la muestra puede ser necesario.

4voto

Eero Puntos 1612

Estás en lo cierto al concluir que los datos no son normales. Si los datos son normales, entonces esperaríamos que aproximadamente el 16% de las observaciones a ser menor que la media menos la desviación estándar. Con una SD más grande que la media de este número es negativo y el estado que no puede haber números negativos, así que lo que están viendo no es consistente con la distribución normal de los datos. La SD valores son posibles, pero sólo si la distribución es muy sesgada a la derecha (que es común en duración).

Estoy de acuerdo en que la elección de un tamaño de muestra basado en suponiendo que los datos son normales no es una buena idea, pero si usted puede encontrar más información sobre el proceso y encontrar una distribución sesgada a la derecha (una distribución gamma como una posibilidad) que es una suposición razonable, entonces usted podría utilizar para ayudar a determinar el tamaño de la muestra.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X