En los modelos sin los términos de interacción (que es, sin términos que se construyen como el producto de otros términos), cada una de las variables de la regresión coeficiente de la pendiente de la regresión de la superficie en la dirección de esa variable. Es constante, independientemente de los valores de las variables, y por lo tanto puede decirse para medir el efecto general de la variable.
En los modelos con interacciones, esta interpretación puede ser hecho sin mayor calificación sólo para aquellas variables que no están involucrados en las interacciones. Para una variable que interviene en las interacciones, el "principal-efecto" coeficiente de regresión (es decir, el coeficiente de regresión de la variable por sí mismo-es la pendiente de la regresión de la superficie en la dirección de esa variable cuando todas las otras variables que interactúan con la variable tiene valores de cero, y la importancia de la prueba del coeficiente se refiere a la pendiente de la regresión de la superficie sólo en la región de la predictor espacio. Ya que no hay ningún requisito de que no ser en realidad los datos en esa región del espacio, el principal efecto del coeficiente de mayo tienen poco parecido a la pendiente de la regresión de la superficie en la región de la predictor espacio donde los datos fueron realmente observada.
En anova términos, el principal efecto del coeficiente es análoga a la de un simple efecto principal, no la principal efecto. Por otra parte, puede referirse a lo que en un anova de diseño sería celdas vacías en la que los datos fueron suministrados por la extrapolación de las celdas con datos.
Para medir el efecto general de la variable que es análogo a un general de los efectos principales en el análisis de varianza y no extrapolar más allá de la región en la que los datos fueron observados, debemos mirar el promedio de la pendiente de la regresión de la superficie en la dirección de la variable, donde el promedio es de más de la N los casos que fueron realmente observada. Esta pendiente media puede ser expresada como una suma ponderada de los coeficientes de regresión de todos los términos en el modelo que involucran la variable en cuestión.
Los pesos son difícil de describir pero fácil de conseguir. La variable principal efecto del coeficiente de siempre obtiene un peso de 1. Para cada uno de los otros coeficiente de un término que implica dicha variable, el peso es la media de los productos de las otras variables en ese plazo. Por ejemplo, si tenemos cinco "raw" variables x1, x2, x3, x4, x5
, más de cuatro interacciones de dos (x1,x2), (x1,x3), (x2,x3), (x4,x5)
, y una interacción de tres vías (x1,x2,x3)
, entonces el modelo es
y = b0 + b1*x1 + b2*x2 + b3*x3 + b4*x4 + b5*x5 +
b12*x1*x2 + b13*x1*x3 + b23*x2*x3 + b45*x4*x5 +
b123*x1*x2*x3 + e
y el conjunto de efectos principales son
B1 = b1 + b12*M[x2] + b13*M[x3] + b123*M[x2*x3],
B2 = b2 + b12*M[x1] + b23*M[x3] + b123*M[x1*x3],
B3 = b3 + b13*M[x1] + b23*M[x2] + b123*M[x1*x2],
B4 = b4 + b45*M[x5],
B5 = b5 + b45*M[x4],
donde M[.] denota la media de la muestra de la cantidad dentro del paréntesis. Todo el producto de los términos dentro de los paréntesis son algunos de los que fueron construidos con el fin de hacer la regresión, por lo que una regresión programa ya debe saber acerca de ellos y debe ser capaz de imprimir sus medios en la solicitud.
En los modelos que sólo tienen efectos principales y las interacciones de dos, hay una manera más simple de obtener los efectos generales: centro[1] la cruda variables en sus medios. Esto se debe hacer antes de calcular el producto de los términos, y no se debe hacer a los productos. A continuación, todos los M[.] las expresiones se convierten en 0, y los coeficientes de regresión será interpretable como efectos generales. Los valores de la b va a cambiar; los valores de la B no. Sólo las variables que intervienen en las interacciones deben estar centrados, pero generalmente no hay daño en el centrado de otras variables medidas. El efecto general de centrado de una variable es que, además de cambiar la intersección, solo cambia los coeficientes de las otras variables que interactúan con el centrado de la variable. En particular, no cambia los coeficientes de los términos que involucran el centro de la variable. En el ejemplo anterior, centrado x1 iba a cambiar b0, b2, b3, y b23.
[1 -- "Centrado" es utilizado por diferentes personas en formas que difieren sólo lo suficiente para causar confusión. Como se usa aquí, "el centrado de una variable en #" significa restar # de todas las puntuaciones en la variable, la conversión de las partituras originales para las desviaciones de #.]
Así que ¿por qué no siempre se centro en los medios, de forma rutinaria? Tres razones. En primer lugar, el principal efecto de los coeficientes de la uncentered variables pueden ser de su interés. Centrado en tales casos sería contraproducente, ya que cambia el principal efecto de los coeficientes de las otras variables.
Segundo, centrado hará todos los M[.] las expresiones de 0, y así convertir los efectos simples a efectos generales, sólo en los modelos sin tres o más interacciones. Si el modelo contiene tales interacciones, a continuación, el b -> B los cálculos se debe realizar aún, incluso si todas las variables están centradas en sus medios.
Tercero, centrado en un valor como la media, que es definida por la distribución de los predictores en lugar de ser elegido racionalmente, significa que todos los coeficientes que se ven afectados por centrar será específica para el particular de la muestra. Si en el centro de la media, a continuación, alguien que intenta replicar el estudio del centro en su decir, no de su propio decir, si quieres obtener los mismos coeficientes que tienes. La solución a este problema es el centro de cada variable en un racionalmente elegido valor central de la variable que depende del significado de las puntuaciones y no depende de la distribución de las puntuaciones. Sin embargo, el b -> B cálculos todavía siguen siendo necesarios.
La importancia de los efectos globales pueden ser probados por los procedimientos habituales para la prueba de las combinaciones lineales de coeficientes de regresión. Sin embargo, los resultados deben interpretarse con cuidado debido a los efectos generales no son parámetros estructurales, pero son de diseño-dependiente. Los parámetros estructurales -- los coeficientes de regresión (descentrada, o con racional centrado) y la varianza de error, que puede ser espera que permanecen invariantes bajo cambios en la distribución de los predictores, pero el efecto global será en general el cambio. Los efectos generales son específicos para el particular de la muestra y no se debe esperar para llevar a otras muestras con diferentes distribuciones de los predictores. Si un efecto general es significativa en un estudio y no en otro, puede reflejar nada más que una diferencia en la distribución de los predictores. En particular, no debe ser tomado como evidencia de que la relación de la variable dependiente para los predictores es diferente en los dos estudios.