7 votos

La comprensión de regresión múltiple de salida

Yo soy de primer año de estudiante de psicología. Estoy haciendo un trabajo de investigación con un profesor, por desgracia, el material que necesito para utilizar ahora está cubierto sólo en mi segundo año. Pero necesito ya lo saben ahora. Así que me estoy quemando a través de cualquiera de los recursos que puedo encontrar para entrar rápidamente a la velocidad. Necesito ayuda para entender esta situación en particular aquí. Consiste en el SAS, el Análisis de Regresión.

Cuando me encontré con una regresión en SAS ( proc reg ) utilizando dos variables decir a y b. Tengo este. Yo entiendo esto como diciendo que estas dos variables (a y b) no se puede predecir de manera significativa mi variable de destino. Aquí está el SAS de salida.

                                     Analysis of Variance

                                            Sum of           Mean
        Source                   DF        Squares         Square    F Value    Pr > F

        Model                     2        3.32392        1.66196       1.00    0.3774
        Error                    46       76.80649        1.66971
        Corrected Total          48       80.13041


                     Root MSE              1.29217    R-Square     0.0415
                     Dependent Mean       -0.23698    Adj R-Sq    -0.0002
                     Coeff Var          -545.26074


                                     Parameter Estimates

                            Parameter       Standard                           Standardized
   Variable         DF       Estimate          Error    t Value    Pr > |t|        Estimate

   Intercept         1       -0.25713        0.18515      -1.39      0.1716               0
   a                 1       -0.35394        0.28797      -1.23      0.2253        -0.19510
   b                 1       -0.04706        0.39586      -0.12      0.9059        -0.01887

Ahora he intentado incluir la interacción de a y b en la imagen. Vamos a llamarlo aXb, ahora la salida de colocar indica que una y aXb predecir de manera significativa mi variable de destino.

                                     Analysis of Variance

                                            Sum of           Mean
        Source                   DF        Squares         Square    F Value    Pr > F

        Model                     3       16.64439        5.54813       3.93    0.0142
        Error                    45       63.48602        1.41080
        Corrected Total          48       80.13041


                     Root MSE              1.18777    R-Square     0.2077
                     Dependent Mean       -0.23698    Adj R-Sq     0.1549
                     Coeff Var          -501.20683


                                     Parameter Estimates

                            Parameter       Standard                           Standardized
   Variable         DF       Estimate          Error    t Value    Pr > |t|        Estimate

   Intercept         1       -0.06807        0.18098      -0.38      0.7086               0
   a                 1        3.01517        1.12795       2.67      0.0104         1.66201
   b                 1       -0.00994        0.36407      -0.03      0.9783        -0.00399
   aXb               1       -1.13782        0.37029      -3.07      0.0036        -1.90743

Aquí están mis preguntas: no estoy seguro de qué hacer para salir de esta situación. Tomados en conjunto ¿qué nos indica esto a mí? Además, mientras que responder a la pregunta, podrías complementarlo con algunos recursos, goog palabras clave, etc para mí para aprender más alrededor de estos temas.

Muchas gracias por tu ayuda.

8voto

Rob Wells Puntos 361

Los dos juntos, no dicen nada más que el segundo solo! Los principales efectos son poco interesantes y engañosa cuando existe interacción presente. El segundo modelo te dice todo lo que usted necesita saber. Aquí hay un par de parcelas, con código R, para ayudarle a entender lo que el segundo modelo que se parece a...

library(lattice)

a <- rep(seq(-1.37, 2.12, (2.12--1.37)/9),4) 
b <- sort(rep(quantile(seq(-1.03, 1.30, .01),c(.2,.4,.6,.8)),10) )
y <- -0.06807 + (3.01517 * a) + (-0.00994 * b) + (-1.13782 *a*b)

xyplot(y~a|factor(b))

Effect of a on y by Levels of b

Esta muestra el efecto estimado de un sobre y por los niveles de b. En cada nivel de b, la relación es positiva. Este es su pendiente positiva para el efecto principal de una en presencia de la interacción de una:b.

a <- sort(rep(quantile(seq(-1.37, 2.12, .01),c(.2,.4,.6,.8)),10) )
b <- rep(seq(-1.03, 1.30, (1.30--1.03)/9),4) 
y <- -0.06807 + (3.01517 * a) + (-0.00994 * b) + (-1.13782 *a*b)

xyplot(y~b|factor(a))

Effect of b on y by Levels of a

Esta es la imagen muestra la estimación de los efectos de b en y dentro de los niveles de una. Usted puede ver por qué usted no tiene ningún efecto principal significativo para b. La dirección de el y~b de esta relación depende el nivel de una. Por lo tanto, no hay relación independiente (imaginar un promedio de estas líneas), pero una interacción significativa (patrón claro cuando se toma en cuenta el nivel de una)

2voto

Zizzencs Puntos 1358

Si quieres un libro específicamente en este tipo de regresión, en contraposición, el análisis de datos en general recomiendo el Análisis de Regresión por Ejemplo por Chatterjee y Precio. Bueno, no es técnico, pero no simplificar en exceso.

2voto

Joe W. Puntos 849

Usted puede estar interesado por esta introducción al modelo lineal (base de casi cualquier análisis estadísticos), y la regresión lineal, en particular:

  • se explica a fondo muchos de los aspectos matemáticos de regresión lineal, por detallando todas las ecuaciones (que es generalmente a la izquierda para el ejercicio de cualquier otro lugar en el Internet);
  • utiliza una sencilla, pero informativa suficiente, conjunto de datos como un ejemplo;
  • y les da a todos los comandos de R necesarios para hacer los cálculos paso a paso, así como señalar los resultados.

1voto

georg Puntos 1742

Parece que necesita una introducción a la regresión. La gente hizo recomendaciones del libro aquí. Libro gratis las recomendaciones aquí.

Es duro para asegurarse de que usted está haciendo el análisis del derecho, cuando no sabemos lo que las variables son o cuál es la meta. Pero según los resultados, les puedo decir que su segunda regresión especificación se ve mejor que la primera. Lo digo porque tiene dos muy significativos los coeficientes, y el ajustado R^2 valor tuvo un gran salto. Tenga en cuenta, aunque creo que estas pistas importantes, no es cierto que los modelos con mayor número de coeficientes significativos o ajustados más altos de R^2 son consistentemente mejor. Hay un montón de otras cuestiones a considerar.

Sus modelos de regresión son la predicción Y, usando a y b. En el segundo modelo, la estimación de la ecuación de regresión es -0.06807 + (3.01517 * a) - (0.00994 * b) - (1.13782 ** * * * b) En otras palabras, el enchufe en a y b, y se obtiene los modelos de predicción para Y. podría decir mucho más, pero lo voy a dejar allí, y le sugiero que recoger un libro de texto.

Recomiendo encarecidamente que intenta gráficos de los datos. Y con una en el eje x, Y con b en el eje x, y una por b así.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X