2 votos

La variable independiente tiene el mismo valor

Estoy haciendo una regresión utilizando EViews, pero una de las ocho variables independientes tiene los mismos valores para toda la muestra y muestra cerca de matriz singular error, mi supervisor dijo que todavía se podía hacer como ella dijo que una gran cantidad de una investigación (especialmente likert escala) tiene el mismo valor. Aquí están los datos

Data

Como puedes ver los datos de la 8ª columna tienen el mismo valor. He buscado en internet pero no he encontrado una solución, es la primera vez que hago un análisis de regresión, así que quizás he buscado la palabra clave equivocada.

Gracias

5voto

EdM Puntos 5716

Si se piensa en las variables "independientes" como "predictores", no sirve de nada incluir un "predictor" que no difiere entre los casos. Ese "predictor" concreto no puede ayudar a predecir nada, y no se puede obtener un coeficiente de regresión para él.

La entrada de Wikipedia sobre regresión lineal simple para un único predictor y un único resultado, muestra el caso más sencillo. La fórmula para calcular el coeficiente de regresión $\widehat\beta$ es:

$$\widehat\beta = \frac{ \sum_{i=1}^n (x_i - \bar{x})(y_i - \bar{y}) }{ \sum_{i=1}^n (x_i - \bar{x})^2 } \\[6pt] $$

donde $x_i$ son los valores individuales de los predictores y $\bar x$ es su media. Si todos los $x_i$ son iguales, entonces $(x_i - \bar{x})=0$ para todos los casos. Por tanto, tanto el numerador como el denominador son 0; no existe un valor definido de forma única $\widehat\beta$ .

La cosa no mejora en el contexto de la regresión múltiple (predictor múltiple). Para que la regresión múltiple funcione, las columnas de la matriz de diseño deben ser linealmente independientes. Es decir, no se puede escribir ninguna columna como una suma ponderada de las otras columnas, o de lo contrario tendremos una regresión perfecta. multicolinealidad y una solución indefinida. Para valores numéricos como los suyos, la matriz de diseño es la matriz o valores predictores junto con una columna de 1s que representa el intercepto del modelo. Si un predictor es constante, es un múltiplo constante de esa columna de intercepción en la matriz de diseño. Esa multicolinealidad perfecta impide encontrar una solución única a la regresión si se incluye un intercepto en el modelo.

Tu sentido común es correcto y, según lo que has expuesto aquí, tu supervisor es incorrecto. Elimine esos "predictores" constantes de su modelo. Si su supervisor insiste en afirmar que es necesario incluirlos, insista a su vez en que su supervisor le muestre cómo hacerlo de forma coherente con las expectativas de su campo de estudio. Tal vez haya formas aceptadas en ese campo de elegir una de las infinitas soluciones posibles en una situación como ésta, pero asegúrese de que usted y su supervisor saben exactamente lo que están haciendo si siguen ese camino.

0voto

Jayaram Iyer Puntos 173

Una variable independiente con los mismos valores en todas las observaciones puede servir de sesgo para un modelo de regresión. Asegúrese de que la herramienta que utiliza no añade su propio sesgo al conjunto de variables independientes. Esto debería eliminar el error de matriz singular que se produce porque tanto su variable independiente (con valores constantes) como la característica de sesgo añadida por la herramienta son linealmente dependientes.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X