Donde es la varianza compartida entre todos los IVs en un lineal de la ecuación de regresión múltiple?

Question

Donde es la varianza compartida entre todos los IVs en un lineal de la ecuación de regresión múltiple?

Preguntado el 18 de Marzo, 2012: Cuando se hizo la pregunta
2237 visitas: Cuantas visitas ha tenido la pregunta
2 Respuestas: Cuantas respuestas ha tenido la pregunta
Resuelta: Estado actual de la pregunta

En un lineal de la ecuación de regresión múltiple, si la beta pesos reflejar la contribución individual de cada variable independiente sobre y por encima de la contribución de todos los otros IVs, donde en la ecuación de regresión es la varianza compartida por todos los IVs que predice la DV?

Por ejemplo, si el diagrama de Venn muestra a continuación (y tomado de CV "acerca de" de la página aquí: http://stats.stackexchange.com/about) fueron re-etiquetar a 3 IVs y 1 DV, ¿qué sería de la zona con el asterisco entrar en la ecuación de regresión múltiple?

enter image description here

Preguntado el 18 de Marzo, 2012 por JW.

Answer 1

2 Respuestas

Answer 2

9voto

Sean Hanley Puntos 2428

Para entender lo que el diagrama podría decir, tenemos que definir algunas cosas. Digamos que el diagrama de Venn muestra la superposición (o compartida) variación entre 4 diferentes variables, y que queremos predecir el nivel de $Wiki$ por recurrir a nuestro conocimiento de $Digg$ , $Forum$ , y $Blog$ . Es decir, queremos ser capaces de reducir la incertidumbre (es decir, la varianza) en $Wiki$ de la nula variación abajo a la varianza residual. Lo bien que se puede hacer? Esa es la pregunta que un diagrama de Venn es responder para usted.

Cada círculo representa un conjunto de puntos, y por lo tanto, una cantidad de la varianza. Para la mayor parte, estamos interesados en la variación en $Wiki$ , pero la figura también muestra que las variaciones en los predictores. Hay un par de cosas para el aviso sobre nuestra figura. En primer lugar, cada variable tiene la misma cantidad de varianza-todos son del mismo tamaño (aunque no todo el mundo el uso de diagramas de Venn tan literalmente). También, hay la misma cantidad de superposición, etc., etc. Una cosa más importante a notar es que hay una buena cantidad de superposición entre las variables predictoras. Esto significa que están correlacionados. Esta situación es muy común cuando se trata con secundaria (es decir, archivos de datos), las investigaciones observacionales, o en el mundo real de predicción de escenarios. Por otro lado, si se tratara de un experimento diseñado, probablemente implicaría un mal diseño o de ejecución. Para continuar con este ejemplo un poco más, podemos ver que nuestra capacidad predictiva será moderada; la mayor parte de la variabilidad en $Wiki$ permanece como la variabilidad residual después de todas las variables que se han utilizado (mirando hacia el diagrama, me imagino $R^2\approx.35$ ). Otra cosa a tener en cuenta es que, una vez $Digg$ $Blog$ han sido introducidas en el modelo, $Forum$ cuentas por ninguno de la variabilidad en $Wiki$ .

Ahora, después de ajustar un modelo con múltiples predictores, la gente a menudo quieren probar los predictores para ver si están relacionados con la variable de respuesta (aunque no está claro que esto es tan importante como la gente parece creer que lo es). Nuestro problema es que para poner a prueba estos predictores, debemos partición de la Suma de los Cuadrados, y desde nuestra predictores están correlacionadas, hay SS que podría ser atribuido a más de un predictor. De hecho, en el asterisco de la región, la SS podría atribuirse a cualquiera de los tres predictores. Esto significa que no existe una única partición de la SS, y por lo tanto no hay una única prueba. Cómo este tema es tratado depende del tipo de SS que el investigador utiliza y otros juicios realizados por el investigador. Dado que muchas de las aplicaciones de software de retorno de tipo III SS por defecto, muchas personas deseche la información contenida en las regiones superpuestas sin darse cuenta de que han hecho una llamada a juicio. Yo explicar estas cuestiones, los diferentes tipos de SS, y entrar con detalle aquí.

La cuestión, como se ha dicho, especificamente pregunta acerca de donde todo esto se muestra en las betas / ecuación de regresión. La respuesta es que no. Algo de información sobre la que está contenida en mi respuesta aquí (aunque tendrás que leer entre líneas un poco).

Respondido el 18 de Marzo, 2012 por Sean Hanley (2428 Puntos )

Answer 3

6voto

Neal Puntos 316

Peter Kennedy tiene una buena descripción de la Ballentine/diagramas de Venn para la regresión en su libro y JSE artículo, incluidos los casos en los que se puede llevar por mal camino.

Lo esencial es que la protagonizó el área de la variación es echado fuera sólo para la estimación y las pruebas de la pendiente de los coeficientes. La variación que se agrega en el propósito de la predicción y el cálculo de $R^2$ .

Respondido el 3 de Marzo, 2014 por Neal (316 Puntos )

Donde es la varianza compartida entre todos los IVs en un lineal de la ecuación de regresión múltiple?

Respuestas

Preguntas Destacadas

Etiquetas mas usadas

i-Ciencias.com

Powered by:

Donde es la varianza compartida entre todos los IVs en un lineal de la ecuación de regresión múltiple?

Respuestas

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

i-Ciencias.com

Powered by: