las páginas de ayuda en R asumen que sé lo que significan esos números. No lo sé.) Estoy tratando de entender realmente intuitivamente cada número aquí. Sólo publicaré el resultado y comentaré lo que he averiguado. Puede que haya (haya) errores, ya que sólo escribiré lo que supongo. Por favor, corrígeme, y editaré las partes equivocadas.
Principalmente me gustaría saber qué significa el valor t en los coeficientes, y por qué imprimen el error estándar residual. Espero que alguien pueda aclararlo.
Call:
lm(formula = iris$Sepal.Width ~ iris$Petal.Width)
Residuals:
Min 1Q Median 3Q Max
-1.09907 -0.23626 -0.01064 0.23345 1.17532
Un resumen de 5 puntos de los residuos (su media es siempre 0, ¿verdad?). Los números pueden ser usados (supongo que aquí) para ver rápidamente si hay grandes valores atípicos. También puedes ver aquí si los residuos están lejos de estar distribuidos normalmente (deberían estar distribuidos normalmente).
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 3.30843 0.06210 53.278 < 2e-16 ***
iris$Petal.Width -0.20936 0.04374 -4.786 4.07e-06 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Estimaciones $ \hat { \beta_i }$ calculada por la regresión de los mínimos cuadrados. Además, el error estándar $ \sigma_ { \beta_i }$ . Me gustaría saber cómo se calcula esto.
Además, ni idea de dónde vienen el valor t y la p correspondiente. Yo sé $ \hat { \beta }$ debería estar distribuido normalmente, pero ¿cómo se calcula el valor t?
Residual standard error: 0.407 on 148 degrees of freedom
$ \sqrt { \frac {1}{n-p} \epsilon ^T \epsilon }$ Supongo que ¿Pero por qué calculamos eso, y qué nos dice?
Multiple R-squared: 0.134, Adjusted R-squared: 0.1282
$ R^2 = \frac {s_ \hat {y}^2}{s_y^2} $ que es $ \frac { \sum_ {i=1}^n ( \hat {y_i}- \bar {y})^2}{ \sum_ {i=1}^n (y_i- \bar {y})^2} $ . La proporción es cercana a 1 si los puntos se encuentran en línea recta, y 0 si son aleatorios.
¿Qué es el R-cuadrado ajustado?
F-statistic: 22.91 on 1 and 148 DF, p-value: 4.073e-06
F y p de la todo modelo, no sólo para una sola $ \beta_i $ como los anteriores. El valor de F es $ \frac {s^2_{ \hat {y}}}{ \sum\epsilon_i } $ . Cuanto más grande crece, más improbable es que el $ \beta $ no tienen ningún efecto en absoluto.
0 votos
Los residuos no se desvían tanto de la normalidad, ¿por qué lo cree?
0 votos
@nico: Creo que @Alexx Hardt estaba hablando hipotéticamente. Es decir, una vez podría utilizar el resumen de cinco números para ver si los residuos se desvían de la normalidad
0 votos
@Gavin Simpson: tienes razón, interpreté mal la frase. No tengas en cuenta mi comentario anterior.
9 votos
Una pequeña objeción: No se puede decir nada sobre la normalidad o la no normalidad basándose únicamente en esos 5 cuantiles. Todo lo que se puede decir basándose en ese resumen es si los residuos estimados son aproximadamente simétricos en torno a cero. Podrías dividir los cuantiles reportados por el error estándar de los residuos estimados y comparar estos valores con los respectivos cuantiles del N(0,1), pero mirar un gráfico QQ probablemente tiene más sentido.
5 votos
Una nota aquí: el modelo $F$ no es $SS_{model} / SS_{error}$ más bien es $MS_{model} / MS_{error}$ . $F$ se describe correctamente en la respuesta de abajo, pero no menciona explícitamente que está mal caracterizado en la pregunta, por lo que alguien podría no darse cuenta de la discrepancia.