Para entender lo que el diagrama podría decir, tenemos que definir algunas cosas. Digamos que el diagrama de Venn muestra la superposición (o compartida) variación entre 4 diferentes variables, y que queremos predecir el nivel de Wiki por recurrir a nuestro conocimiento de Digg, Forum, y Blog. Es decir, queremos ser capaces de reducir la incertidumbre (es decir, la varianza) en Wiki de la nula variación abajo a la varianza residual. Lo bien que se puede hacer? Esa es la pregunta que un diagrama de Venn es responder para usted.
Cada círculo representa un conjunto de puntos, y por lo tanto, una cantidad de la varianza. Para la mayor parte, estamos interesados en la variación en Wiki, pero la figura también muestra que las variaciones en los predictores. Hay un par de cosas para el aviso sobre nuestra figura. En primer lugar, cada variable tiene la misma cantidad de varianza-todos son del mismo tamaño (aunque no todo el mundo el uso de diagramas de Venn tan literalmente). También, hay la misma cantidad de superposición, etc., etc. Una cosa más importante a notar es que hay una buena cantidad de superposición entre las variables predictoras. Esto significa que están correlacionados. Esta situación es muy común cuando se trata con secundaria (es decir, archivos de datos), las investigaciones observacionales, o en el mundo real de predicción de escenarios. Por otro lado, si se tratara de un experimento diseñado, probablemente implicaría un mal diseño o de ejecución. Para continuar con este ejemplo un poco más, podemos ver que nuestra capacidad predictiva será moderada; la mayor parte de la variabilidad en Wiki permanece como la variabilidad residual después de todas las variables que se han utilizado (mirando hacia el diagrama, me imagino R^2\approx.35). Otra cosa a tener en cuenta es que, una vez Digg Blog han sido introducidas en el modelo, Forum cuentas por ninguno de la variabilidad en Wiki.
Ahora, después de ajustar un modelo con múltiples predictores, la gente a menudo quieren probar los predictores para ver si están relacionados con la variable de respuesta (aunque no está claro que esto es tan importante como la gente parece creer que lo es). Nuestro problema es que para poner a prueba estos predictores, debemos partición de la Suma de los Cuadrados, y desde nuestra predictores están correlacionadas, hay SS que podría ser atribuido a más de un predictor. De hecho, en el asterisco de la región, la SS podría atribuirse a cualquiera de los tres predictores. Esto significa que no existe una única partición de la SS, y por lo tanto no hay una única prueba. Cómo este tema es tratado depende del tipo de SS que el investigador utiliza y otros juicios realizados por el investigador. Dado que muchas de las aplicaciones de software de retorno de tipo III SS por defecto, muchas personas deseche la información contenida en las regiones superpuestas sin darse cuenta de que han hecho una llamada a juicio. Yo explicar estas cuestiones, los diferentes tipos de SS, y entrar con detalle aquí.
La cuestión, como se ha dicho, especificamente pregunta acerca de donde todo esto se muestra en las betas / ecuación de regresión. La respuesta es que no. Algo de información sobre la que está contenida en mi respuesta aquí (aunque tendrás que leer entre líneas un poco).