10 votos

¿Cuál es la hipótesis nula para los valores p individuales en la regresión múltiple?

Tengo un modelo de regresión lineal para una variable dependiente $Y$ basado en dos variables independientes, $X1$ y $X2$ Así que tengo una forma general de una ecuación de regresión

$Y = A + B_1 \cdot X_1 + B_2 \cdot X_2 + \epsilon$ ,

donde $A$ es la intercepción, $\epsilon$ es el término de error, y $B_1$ y $B_2$ son los respectivos coeficientes de $X_1$ y $X_2$ . Realizo una regresión múltiple con un software (statsmodel en Python) y obtengo los coeficientes del modelo: $A = a, B_1 = b_1, B_2 = b_2$ . El modelo también me da $p$ para cada coeficiente: $p_a$ , $p_1$ y $p_2$ . Mi pregunta es: ¿Cuál es la hipótesis nula para esos individuos $p$ ¿valores? Por ejemplo, para obtener $p_1$ Sé que la hipótesis nula implica un coeficiente 0 para $B_1$ Pero, ¿qué pasa con las demás variables? En otras palabras, si la hipótesis nula es $Y = A + 0 \cdot X_1 + B_2 \cdot X_2$ ¿Cuáles son los valores de $A$ y $B_2$ para la hipótesis nula a partir de la cual el $p$ -valor para $B_1$ ¿se deriva?

4 votos

A su modelo le falta un término de error.

7voto

Andreas Dzemski Puntos 116

La hipótesis nula es $$ H_0: B1 = 0 \: \text{and} \: B2 \in \mathbb{R} \: \text{and} \: A \in \mathbb{R}, $$ lo que significa básicamente que la hipótesis nula no restringe B2 y A. La hipótesis alternativa es $$ H_1: B1 \neq 0 \: \text{and} \: B2 \in \mathbb{R} \: \text{and} \: A \in \mathbb{R}. $$ En cierto modo, la hipótesis nula en el modelo de regresión múltiple es una hipótesis compuesta. Es una "suerte" que podamos construir un estadístico de prueba pivotante que no dependa del valor verdadero de B2 y A, de modo que no suframos una penalización por probar una hipótesis nula compuesta.

En otras palabras, hay muchas distribuciones diferentes de $(Y, X1, X2)$ que son compatibles con la hipótesis nula $H_0$ . Sin embargo, todas estas distribuciones conducen al mismo comportamiento del estadístico de prueba que se utiliza para probar $H_0$ .

En mi respuesta, no he abordado la distribución de $\epsilon$ y se asume implícitamente que es una variable aleatoria normal centrada independiente. Si sólo asumimos algo como $$ E[\epsilon \mid X1, X2] = 0 $$ entonces una conclusión similar se mantiene asintóticamente (bajo supuestos de regularidad).

0 votos

Pero, según entiendo, ¿la hipótesis nula no tiene que ser una distribución de probabilidad? Si tengo valores específicos para los coeficientes, puedo generar una distribución de probabilidad añadiendo ruido (épsilon) a la ecuación de regresión. Pero si no tengo valores específicos para los coeficientes, ¿cómo podría generar la distribución de probabilidad nula?

0 votos

Una hipótesis nula compuesta es todo un conjunto de posibles medidas de probabilidad.

0 votos

He editado mi respuesta para enfatizar este punto.

-1voto

Logicseeker Puntos 18

Puedes hacer las mismas suposiciones para las otras variables que el X1. La tabla ANOVA de la regresión ofrece información específica sobre la significación de cada variable y también sobre la significación global.En cuanto al análisis de regresión, la aceptación de la hipótesis nula implica que el coeficiente de la variable es cero, dado un determinado nivel de significación.

Si quiere adquirir un aspecto más intuitivo de la cuestión, puede estudiar más sobre las pruebas de hipótesis.

-1voto

El $p$ -Los valores son el resultado de una serie de $t$ -prueba. La hipótesis nula es que $B_j=0$ mientras que la hipótesis alternativa (de nuevo, para cada coeficiente) es, $B_j\ne0$

(para más detalles, consulte aquí: http://reliawiki.org/index.php/Multiple_Linear_Regression_Analysis#Test_on_Individual_Regression_Coefficients_.28t__Test.29 )

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X