Processing math: 7%

11 votos

Donde es la varianza compartida entre todos los IVs en un lineal de la ecuación de regresión múltiple?

En un lineal de la ecuación de regresión múltiple, si la beta pesos reflejar la contribución individual de cada variable independiente sobre y por encima de la contribución de todos los otros IVs, donde en la ecuación de regresión es la varianza compartida por todos los IVs que predice la DV?

Por ejemplo, si el diagrama de Venn muestra a continuación (y tomado de CV "acerca de" de la página aquí: http://stats.stackexchange.com/about) fueron re-etiquetar a 3 IVs y 1 DV, ¿qué sería de la zona con el asterisco entrar en la ecuación de regresión múltiple?

enter image description here

9voto

Sean Hanley Puntos 2428

Para entender lo que el diagrama podría decir, tenemos que definir algunas cosas. Digamos que el diagrama de Venn muestra la superposición (o compartida) variación entre 4 diferentes variables, y que queremos predecir el nivel de Wiki por recurrir a nuestro conocimiento de Digg, Forum, y Blog. Es decir, queremos ser capaces de reducir la incertidumbre (es decir, la varianza) en Wiki de la nula variación abajo a la varianza residual. Lo bien que se puede hacer? Esa es la pregunta que un diagrama de Venn es responder para usted.

Cada círculo representa un conjunto de puntos, y por lo tanto, una cantidad de la varianza. Para la mayor parte, estamos interesados en la variación en Wiki, pero la figura también muestra que las variaciones en los predictores. Hay un par de cosas para el aviso sobre nuestra figura. En primer lugar, cada variable tiene la misma cantidad de varianza-todos son del mismo tamaño (aunque no todo el mundo el uso de diagramas de Venn tan literalmente). También, hay la misma cantidad de superposición, etc., etc. Una cosa más importante a notar es que hay una buena cantidad de superposición entre las variables predictoras. Esto significa que están correlacionados. Esta situación es muy común cuando se trata con secundaria (es decir, archivos de datos), las investigaciones observacionales, o en el mundo real de predicción de escenarios. Por otro lado, si se tratara de un experimento diseñado, probablemente implicaría un mal diseño o de ejecución. Para continuar con este ejemplo un poco más, podemos ver que nuestra capacidad predictiva será moderada; la mayor parte de la variabilidad en Wiki permanece como la variabilidad residual después de todas las variables que se han utilizado (mirando hacia el diagrama, me imagino R^2\approx.35). Otra cosa a tener en cuenta es que, una vez Digg Blog han sido introducidas en el modelo, Forum cuentas por ninguno de la variabilidad en Wiki.

Ahora, después de ajustar un modelo con múltiples predictores, la gente a menudo quieren probar los predictores para ver si están relacionados con la variable de respuesta (aunque no está claro que esto es tan importante como la gente parece creer que lo es). Nuestro problema es que para poner a prueba estos predictores, debemos partición de la Suma de los Cuadrados, y desde nuestra predictores están correlacionadas, hay SS que podría ser atribuido a más de un predictor. De hecho, en el asterisco de la región, la SS podría atribuirse a cualquiera de los tres predictores. Esto significa que no existe una única partición de la SS, y por lo tanto no hay una única prueba. Cómo este tema es tratado depende del tipo de SS que el investigador utiliza y otros juicios realizados por el investigador. Dado que muchas de las aplicaciones de software de retorno de tipo III SS por defecto, muchas personas deseche la información contenida en las regiones superpuestas sin darse cuenta de que han hecho una llamada a juicio. Yo explicar estas cuestiones, los diferentes tipos de SS, y entrar con detalle aquí.

La cuestión, como se ha dicho, especificamente pregunta acerca de donde todo esto se muestra en las betas / ecuación de regresión. La respuesta es que no. Algo de información sobre la que está contenida en mi respuesta aquí (aunque tendrás que leer entre líneas un poco).

6voto

Neal Puntos 316

Peter Kennedy tiene una buena descripción de la Ballentine/diagramas de Venn para la regresión en su libro y JSE artículo, incluidos los casos en los que se puede llevar por mal camino.

Lo esencial es que la protagonizó el área de la variación es echado fuera sólo para la estimación y las pruebas de la pendiente de los coeficientes. La variación que se agrega en el propósito de la predicción y el cálculo de R^2.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X