2 votos

Comprobación de los supuestos del modelo en un $5 \times 3 \times 5$ diseño factorial

Digamos que tengo $5$ manchas de una bacteria, y quiero probar el número de bacterias en cada mancha a diferentes temperaturas ( $27, 35$ y $43$ grados), y diferentes concentraciones de un producto aplicado a cada mancha ( $0.6, 1.0, 1.2, 1.4$ y $1.8$ ). Así que al principio consideré un diseño factorial $5\times 3 \times 5$ con dos réplicas para cada factor, y me gustaría probar la significación de cada factor y las interacciones entre ellos. Es decir: $$y_{ijkr} = \mu + \alpha_i + \beta_j + \gamma_k + (\alpha \beta)_{ij} + (\alpha\gamma)_{ik} + (\beta\gamma)_{jk} + (\alpha\beta\gamma)_{ijk} + \epsilon_{ijkr}$$ donde $y_{ijkr}$ es la variable dependiente (número de bacterias), $\mu$ es la media global, $\alpha_i$ es el efecto de la $i$ -nivel del factor $A$ ( $A$ = manchas) donde $i = 1, \dots 5$ , $\beta_j$ es el efecto de la $j$ -nivel del factor $ B$ ( $B$ = temperatura) donde $j = 1, 2, 3$ , $\gamma_k$ es el efecto de la $k$ -nivel del factor $C$ ( $C$ = nivel de concentración), donde $k = 1, \dots , 5$ , $\epsilon_{ijkr} \sim N(0, \sigma)$ y $r$ es el número de réplicas, en este caso $2$ , lo que hace un total de $150$ observaciones.

Primero tengo que comprobar la hipótesis del modelo. La hipótesis de normalidad debe comprobarse para cada factor, pero el problema es que la prueba de Shapiro-Wilk del SPSS muestra normalidad para algunos factores y no normalidad para otros. Sin embargo, al observar los gráficos Q-Q, no parece haber una diferencia realmente significativa con la línea. Así que

¿Debo aceptar la hipótesis de que los datos proceden de una distribución normal?

También debería comprobar la homocedasticidad, pero al hacer la tabla ANOVA con la prueba de Levene, me aparece un mensaje que dice "No se puede calcular el estadístico de Levene porque las desviaciones absolutas son constantes dentro de cada celda".

¿Por qué recibo ese mensaje? ¿Cómo puedo comprobar la homocedasticidad sin la prueba de Levene?

3voto

mdewey Puntos 579

Me temo que su afirmación de que hay que comprobar la hipótesis de normalidad para cada factor no es correcta. Lo que hay que comprobar, si es que hay que comprobar algo, es la normalidad de los residuos del modelo. Del mismo modo, si quiere trazar un gráfico Q-Q, esto se hace para los residuos.

La hipótesis de que la varianza no depende de la media puede examinarse mejor si se comparan los residuos con los valores predichos por el modelo. El trazado de versiones transformadas (la raíz cuadrada del valor absoluto del residuo) puede ofrecer un trazado más claro, ya que la relación entre la media y la varianza se muestra mediante una línea recta.

Pero, como sugiere @mkt en los comentarios, primero hay que asegurarse de tener un modelo científicamente sensato.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X