5 votos

¿Puedo modelo de desviaciones estándar en un modelo lineal?

Es posible poner estándar de las desviaciones o variaciones en un modelo lineal, ya que los datos para ser explicado? Tengo un predictor que creo que va a aumentar de forma lineal, la desviación estándar de una medida, y es esta variabilidad que es de interés.

Para cada condición, he calculado la desviación estándar, así que tengo un vector de desviaciones estándar que me gustaría modelo. Luego alimenta esta en un modelo lineal

std_k( y_ik ) =  X_ij * beta_j + error_ij

donde X es algo como

[ 1  -2 
  1  -1
  1   0
  1   1
  1   2 ]

Me doy cuenta de que las desviaciones estándar no están normalmente distribuidos, así que esto no es del todo correcto. Puedo transformar la variable, por lo que los términos de error normalmente distribuido? O puedo usar una "generalizada" modelo lineal con una función de enlace?

(De hecho, me quieren darle de comer en un modelo mixto, ya que varios sujetos a cabo el experimento. Cada asignatura tiene una línea de base diferente de la variabilidad, y quiero ver a la variabilidad entre los sujetos por condición. También voy a necesitar para comparar grupos de sujetos. Modelo mixto parece apropiado para ese propósito)

7voto

anand Puntos 199

Sí, usted puede hacer esto. Un GLM de la SDs con un registro de enlace y una gamma de la familia es una forma de hacerlo, si usted piensa que las poblaciones son normales.

También es común que las personas regresión log SD en un montón de predictores. Es aproximado, pero todos los modelos. Uno de los textos donde se puede ver este hecho es Box, Hunter y Hunter, Estadísticas De los Experimentadores (2ª edición), en su helicóptero experimento en el Capítulo 12.

El registro es intuitivamente correcto aquí porque la escala de parámetros como el SDs se multiplicativo efectos, y el registro de ellos hace el dobladillo aditivo -- apropiado para un modelo lineal.

2voto

Andrew M Puntos 1141

Suena como que usted propone esencialmente un mínimos cuadrados en dos etapas, donde la primera etapa se reduce cada grupo a su desviación estándar acerca de un grupo específico de la media. Esto parece bien, aunque se nota que en realidad puede hacer un modelo en el nivel de observación, es decir, dejar que la varianza para cada observación sea una función lineal de las covariables. Tenga en cuenta que no sé de cualquier off-the-shelf de software que le permiten hacer exactamente eso.

Volviendo al enfoque de dos etapas, si el clúster $i=1,...,N$ están distribuidos normalmente, por ejemplo,$Z_i \sim N(\mu_i, \rho^2_i)$, a continuación, la muestra desviaciones serán escala de chi-cuadrado distribuidos con $N_i -1$ grados de libertad. Dejando $S^2_i$ el valor de la varianza de la muestra en el clúster $i$, luego $$S^2_i \sim \frac{\rho^2_i}{N_i-1} \times \chi^2(N_i-1).$$

En más detalle, tenemos que \begin{align*} E S^2_i & = \rho^2_i, \\ Var S^2_i & = 2\frac{\rho_i^4}{N_i - 1}. \end{align*}

Una gamma GLM se supone que $Var Y = \phi (E Y)^2$, por lo que este hecho podría ser un caso para la gamma de regresión, con una identidad enlace! (Lo cual es una novedad para mí, creo.) Si el $N_i$ diferir mucho, entonces usted necesita precisión pesos $1/(N_i-1)$.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X