4 votos

SLR: ¿por qué el "error estándar" residual se refiere en realidad a RSS/(n-2) y no al error estándar?

Por lo que he aprendido, el error estándar es un concepto relacionado con la distribución muestral. Entonces, ¿por qué se utiliza el término "error estándar residual" para referirse a $\sqrt{\frac{RSS}{n-2}}$ y no $\sqrt{E(r_i - E(r_i))^2}$ ¿en el contexto de una réflex?

(He mencionado la regresión lineal simple sólo porque aún no he aprendido otras técnicas de regresión)

2voto

Aaron Puntos 36

El error estándar residual en este contexto es la raíz cuadrada de la varianza estimada del término de error. En una regresión lineal con un término de intercepción y una única variable explicativa tenemos:

$$\hat{\mathbb{V}}(\varepsilon) = \text{MSE} = \frac{\text{RSS}}{\text{df}_\text{Res}} = \frac{\text{RSS}}{n-2}.$$

Así que la cantidad a la que se refiere es $\hat{\mathbb{S}}(\varepsilon) = \sqrt{\text{RSS}/(n-2)}$ . La otra cantidad a la que se refiere es la desviación estándar del $i$ que no es una cantidad fija a lo largo de $i=1,...,n$ ya que depende de los valores de apalancamiento de los puntos de datos.

0 votos

Bueno, aquí he utilizado r_i como una variable aleatoria y no un valor residual específico de una muestra. Así que mi pregunta era como, ya que se llama 'error estándar' pensé que debe ser algo relacionado con la distribución de muestreo de la variable aleatoria r_i, y no RSS/n-2 que es una estadística calculada a partir de una muestra específica (de n observaciones de r_i)

1 votos

Cada una de las variables aleatorias $R_1,...,R_n$ tienen una varianza diferente, que se ve afectada por el apalancamiento de cada punto de datos. Esto significa que no existe una varianza única y genérica para el residuo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X