52 votos

Las pruebas estadísticas cuando el tamaño de la muestra es 1

Estoy en una escuela secundaria profesor de matemáticas que es un poco perplejo. Un estudiante de Biología vino a mí con su experimento con ganas de saber qué tipo de análisis estadístico que puede hacer con sus datos (sí, él ha decidido que, ANTES de la prueba, pero no me consultadas hasta después).

Él está tratando de determinar lo que el efecto de la insulina sobre la concentración de glucosa en un cultivo celular. Hay seis cultura agrupan en tres pares (uno con insulina y un sin) cada uno bajo condiciones ligeramente diferentes.

El problema es que sólo tomó una muestra de cada uno, de modo que no hay ninguna desviación estándar (o desviación estándar es 0, ya que el valor varía de sí mismo por 0).

Es allí cualquier análisis estadístico se pueden realizar con estos datos? ¿Qué consejos debo darle otra que volver a realizar el experimento?

46voto

icelava Puntos 548

Por desgracia, su hijo tiene un problema.

La idea de cualquier (inferencial) análisis estadístico es entender si un patrón de observaciones puede ser simplemente debido a la variación natural o de la casualidad, o si hay algo sistemático allí. Si la variación natural es grande, entonces la diferencia observada puede ser simplemente debido al azar. Si la variación natural es pequeño, entonces puede ser indicativo de una verdad subyacente efecto.

Con solo un par de observaciones, que no tenemos ni idea de la variación natural en los datos que observamos. Así que nos faltan la mitad de la información que necesitamos.

Usted nota que su estudiante tiene tres pares de observaciones. Por desgracia, se recogieron bajo diferentes condiciones. Por lo que la variabilidad que se observa entre estos tres pares puede ser simplemente debido a las diferentes condiciones, y no nos ayudará para la pregunta subyacente acerca de un posible efecto de la insulina.

Una paja a agarrar sería para tener una idea de la variación natural a través de otros canales. Quizás observaciones similares en condiciones similares se han hecho antes y lo reportado en la literatura. Si es así, podríamos comparar nuestras observaciones a estos datos publicados. (Esto aún sería un problema, ya que los protocolos es casi seguro que han sido un poco diferentes, pero podría ser mejor que nada.)

EDIT: se nota que mi explicación que aquí se aplica al caso en que la condición tiene un impacto potencial sobre el efecto de la insulina, una interacción. Si podemos hacer caso omiso de esta posibilidad y sólo esperan efectos principales (es decir, la condición puede tener un efecto aditivo sobre la glucosa, que es independiente de que el efecto adicional de insulina), entonces podemos, al menos formalmente, de ejecución de un ANOVA como por BruceET la respuesta. Este puede ser el mejor, el alumno es capaz de hacer. (Y que al menos para practicar la escritura de las limitaciones de su estudio, que también es una habilidad importante!)

En su defecto, me temo que la única posibilidad sería la de volver a la mesa de laboratorio y recopilar más datos.


En cualquier caso, esto es una (probablemente doloroso, pero todavía es una gran oportunidad de aprendizaje! Estoy seguro de que este estudiante en el futuro, de pensar siempre en el análisis estadístico antes de la planificación de su estudio, que es como debe ser. Mejor aprender en la escuela secundaria, en lugar de sólo en la universidad.

Permítanme concluir con una cita relevante atribuido a Ronald Fisher:

Para consultar el estadístico después de un experimento es terminado a menudo es simplemente preguntarle a realizar un post mortem. Él puede, tal vez, decir lo que el experimento murió de.

29voto

manku Puntos 111

ANOVA de dos vías con Una Observación por Celda

Después de terminar su importante 'conferencia' acerca de consultar a un estadístico antes de comenzar a tomar datos, usted puede decirle a su estudiante que no hay apenas datos suficientes aquí para apoyar a un legítimo diseño experimental.

Si los sujetos fueron escogidos al azar de algunos relevantes de la población, de las determinaciones de glucosa fueron hechas en el de igual manera para cada uno de los seis temas, y si los niveles de glucosa son algo como una distribución normal, entonces parece posible analizar los resultados de acuerdo a un simple ANOVA de dos vías con una observación por celda.

Los datos pueden ser mostrados es una tabla como esta:

                Insulin
             --------------
Method       Yes         No
---------------------------
     1
     2 
     3

El modelo es $Y_{ij} = \mu + \alpha_i + \beta_j + e_{ij},$ donde $i = 1,2,3$ métodos; $j = 1, 2$ condiciones (Y o N), y $e_{ij} \stackrel{iid}{\sim} \mathsf{Norm}(0, \sigma).$ Usted puede mirar en un nivel intermedio de estadísticas de texto o de nivel de introducción de texto en el diseño de experimentos para obtener más detalles.

El ANOVA de dos vías de diseño permitiría una prueba, si las dos Condiciones diferentes de la glucosa nivel (casi seguramente por lo que si las dosis de insulina son significativas) y si los tres Métodos difieren o son todos de la misma.

Con sólo dos niveles de un factor, sólo dos niveles de la otra, y sólo una observación por celda, no sería posible tomar interacción entre la dosis de insulina y método en cuenta. [No es $(\alpha*\beta)_{ij}$ plazo en el modelo anterior; tendría la misma subíndices como el término de error $e_{ij}.]$

También, probablemente no vale la pena hacer cualquier tipo de test no paramétrico de de prueba (con más de tres Métodos---tal vez un test de Friedman). Que es la razón por la que hice mención destacada por encima de la normalidad.


Ejemplo de uso de datos falsos en R:

gluc = c(110, 135, 123,  200, 210, 234)
meth = as.factor(c(  2,   2,   3,    1,   2,   2))
insl = as.factor(c(  1,   1,   1,    2,   2,   2))
aov.out = aov(gluc ~ meth + insl)
summary(aov.out)
             Df Sum Sq Mean Sq F value Pr(>F)  
meth         2   3119    1559   5.193  0.161  
insl         1   9900    9900  32.973  0.029 *
Residuals    2    600     300                 
---
Signif. codes:  0 ‘***' 0.001 ‘**' 0.01 ‘*' 0.05 ‘.' 0.1 ‘ ' 1

La insulina de efecto significativo en el 3% nivel.

También podría utilizar sólo vinculado a la glucosa las mediciones de Insulina (S/N) en una prueba de t pareada para obtener un resultado significativo. (En el ANOVA de los Métodos de proporcionar un poco de interacción, que no puede ser probado porque no es sólo una observación por celda.)

t.test(gluc~insl, pair=T)

        Paired t-test

data:  gluc by insl
t = -8.812, df = 2, p-value = 0.01263
alternative hypothesis: 
  true difference in means is not equal to 0
95 percent confidence interval:
 -136.92101  -47.07899
sample estimates:
mean of the differences 
                    -92 

Nota: Vea esta demostración para un $2 \times 3$ ANOVA con varias replicaciones por celda, analizó en detalle.

22voto

KevinOelen Puntos 76

BruceET ha descrito el análisis adecuado (ANOVA de Dos vías sin interacción), así que voy a poner una más positiva de giro en el experimento.

Estoy asumiendo que el diseño era de tres pares, donde existe variabilidad entre pares. Uno de cada par se administra la insulina y la otra sin, esperemos que aleatorizado. A continuación, cada una de las muestras (par X tratamiento, llame a la unidad experimental de un petrie) se midió una vez.

1) Esto no es un mal diseño. Este es probablemente uno de los más comúnmente usados en los diseños experimentales en la ciencia - es un bloque completo de diseño (también llamado pares de diseño cuando los bloques se tienen solo dos observaciones). Generalmente, este diseño es superior en potencia a la aún más común diseño completamente al azar (todos los seis unidades experimentales aleatorizados en un conjunto de tres que tengo la insulina y tres que no). Los pares de diseño elimina la variabilidad debido a par-a-par variabilidad. En serio, este diseño es omnipresente en la agricultura, la medicina, etc. La única objeción que tendría es que tres pares podría permitir demasiado poco poder. Pero sin duda es replicado (hay varios pares).

2) parece que la sugerencia fue la de que el estudiante ha muestreado cada petrie varias veces para obtener submuestras. Esta sería una muy mala recomendación. Multiplicar el muestreo de cada unidad experimental para obtener la replicación es un ejemplo de pseudo-replicación. Si el pseudo-replica son el promedio de juntos para producir una medida por petrie plato, se podría reducir la variabilidad de algo, pero no el aumento de los grados de libertad en el análisis a todos. Las submuestras no son independientes. Por eso, es bueno que no se recomienda.

NOTA: Sí, con este diseño no se puede obtener de una cultura:el tratamiento de la interacción de la estimación. Pero ese es también el caso si este había sido diseñado como un diseño completamente al azar. La interacción termina en el ruido.

RESUMEN: El diseño es un clásico del diseño experimental, muy recomendable para este tipo de investigación. También es fácil de analizar. La única objeción sería que los tres pares podría ser de poca potencia.

1voto

Bryan Puntos 51

Si los estudiantes estaban dispuestos a hacer un lugar profundo de buceo, usted puede redirigir su interés a partir de la variación de muestreo para la incertidumbre, y de una prueba de hipótesis para una ampliación de la incertidumbre de intervalo. La variación de muestreo es sólo uno de los componentes de la incertidumbre. Mientras el estudiante no está en posición de evaluar la variabilidad del muestreo, se puede aprender algo de intentar aproximarse a la incertidumbre asociada con sus mediciones. Me imagino que su estudiante no está en la inversión, pero es una sugerencia.

1voto

bohan Puntos 522

Un problema importante es el pequeño tamaño de la muestra la reducción de los grados de libertad en el modelo de selección junto con el modelo requiere/sensibilidad a la normalidad de error de la asunción. La preservación de grados de libertad y de la robustez de la metodología parece ser el mejor camino. Incluso me atrevería a aconsejar a la generación de errores aleatorios de los posibles padres distribuciones, y con el conocimiento de los valores de parámetro real, observando la variación en la estimación de los valores de parámetro y los posibles cambios en los resultados de la prueba.

Como tal, un simple parsimonous enfoque del modelo será el primero en colocar los datos en un formato de regresión de acuerdo con el siguiente modelo reducido de la variable Métodos:

$$ Y_{i,j}-Ymedian = \beta *InsulinDummy_i + \gamma * MethodDummy_j + \varepsilon_{i,j} $$

donde la variable dependiente es el observado de la concentración de glucosa centrado alrededor de la mediana de la población, y la Insulina variable Ficticia (centrada también) es 1/2 si la Insulina está presente en la muestra de prueba yo, otra cosa -1/2. El Método de la variable Ficticia es de 2/3 para el Método 1, los demás -1/3 para los Métodos 2 y 3 (repetir el análisis, intercambio de Método 1 para decir que el Método 2, y repetir de nuevo cambiando el Método 2 Método 3).

Nota de la propuesta de modelo de interpretación de los coeficientes de regresión es que puede ayudar a determinar con precisión de qué lado de la mediana de una observación caerá. Dado el pequeño tamaño de la muestra, sugiero probabilística (incluso Bayesiano) interpretación, cuya exactitud puede ser evaluado en el modelo de simulación de pruebas.

Siguiente, la introducción de un sólido análisis de regresión, donde Menos Absolutos de las Desviaciones (LAD) es una opción. Matemáticamente, el CHAVAL está vinculado a una de Laplace de la distribución de los términos de error. Uno puede calcular los coeficientes de emplear iterativo de Cuadrados mínimos ponderados, o, especialmente en el contexto actual, con 6 puntos de datos, empleando la propiedad de que el modelo de parámetros determinan una línea recta que pasa a través de dos de los puntos observados en el espacio. Esto implica el examen de las permutaciones y las pruebas de la suma total de los absolutos de las desviaciones. Los puntos seleccionados casi siempre evitar los valores atípicos (a diferencia de los mínimos Cuadrados, donde ANOVA se basa también en un error cuadrado criterio).

Para obtener los intervalos de confianza de los parámetros, bootstrap re-muestreo de los términos de error se ha sugerido (ver esto), que también puede ser evaluado en función de la precisión en la simulación de carreras.

[EDITAR] pensé que mi modelo es digno de mayor exploración, por lo que he construido una hoja de cálculo basado en el modelo de simulación (conveniente para el proceso iterativo de LAD iteración, lo que implica examinar el punto de cambio de marchas, lo que los puntos de los errores absolutos son convergentes a cero (indicativo de punto de pares de determinar el MUCHACHO línea de regresión). Aquí está un resumen de una docena de carreras de simulación basado en un uniforme (-0.5 a +.5) error agregado para el modelo propuesto anteriormente.

Subyacente real Simulado Valores de los Parámetros son: 1.250 y 0.100

Ejecución De La Simulación Los Valores De:

El Promedio De Los Valores Observados De 1.225 0.026

Observa La Mediana De 1.224 0.045

Ejecutar 1 1.001 0.324

Ejecutar 2 1.546 0.297

Ejecutar 3 1.350 -0.038

De ejecución de 4 1.283 -0.115

Ejecutar 5 1.593 -0.113

6 1.498 -0.089

Ejecutar 7 0.863 0.151

Ejecutar 8 1.090 de 0,323

Ejecutar 9 1.102 -0.435

Ejecutar 10 1.166 -0.265

Ejecutar 11 1.451 0.128

Ejecutar 12 0.761 0.146

Mi opinión sobre los resultados que los obtenidos de las estadísticas de resumen son increíbles para mi propuesta parsimonous modelo basado en 6 puntos con una uniforme distribución de error de estimación 2 parámetros de datos en un modelo centrado en el empleo de regresión robusta. Carreras individuales de la pantalla, como era de esperar, un buen rango en los valores de los parámetros, pero parece más probable que apuntan a un efecto mayor que 1 para el primer parámetro (solo 2 de los 12 son de menos de 1).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X