34 votos

En el análisis de regresión, ¿por qué llamamos a las variables independientes "independientes"?

Quiero decir que algunas de esas variables están fuertemente correlacionadas entre sí. ¿Cómo / por qué / en qué contexto los definimos como variables independientes ?

35voto

EdM Puntos 5716

Si nos tire hacia atrás desde el día de hoy el énfasis en el aprendizaje de máquina y recordar cuánto de análisis estadístico fue desarrollado para el control de los estudios experimentales, la frase "variables independientes" hace una buena cantidad de sentido.

En el control de los estudios experimentales, la elección de un fármaco y sus concentraciones, o las opciones de un fertilizante y sus montos por hectárea, son realizados de forma independiente por el investigador. El interés está en cómo una variable de respuesta de interés (por ejemplo, la presión arterial, el rendimiento de los cultivos) depende en estas manipulaciones experimentales. Idealmente, las características de las variables independientes están bien especificados, prácticamente sin errores en conocer sus valores. Luego estándar de la regresión lineal, por ejemplo, los modelos de las diferencias entre los valores de las variables dependientes en términos de los valores de las variables independientes además de los errores residuales.

El mismo formalismo matemático utilizado para la regresión en el contexto de control de estudios experimentales también puede ser aplicado para el análisis de los datos observados conjuntos con poca o ninguna manipulación experimental, por lo que tal vez no es sorprendente que la frase "variables independientes" ha llevado a estos tipos de estudios. Pero, como otros en esta página de la nota, que es probablemente una desafortunada elección, con los "predictores" o "características" más apropiado en tales contextos.

20voto

dan90266 Puntos 609

En muchos sentidos, "variable independiente" es una desafortunada elección. Las variables no necesitan ser independientes el uno del otro, y, por supuesto, no necesita ser independiente de la variable dependiente $Y$. En la enseñanza y en mi libro de modelos de Regresión de las Estrategias que utilizo la palabra predictor. En algunas situaciones en las que la palabra no es lo suficientemente fuerte, pero funciona muy bien en promedio. Una descripción completa de la función de la $X$ (lado derecho) de las variables en un modelo estadístico que puede ser demasiado largo para el uso de cada vez: el conjunto de variables o medidas a que la distribución de $Y$ está condicionado. Esta es otra manera de decir que el conjunto de variables cuya distribución actualmente no estamos interesados, pero cuyos valores nos tratan como constantes.

12voto

Aaron Puntos 36

Estoy de acuerdo con las otras respuestas aquí que los "independientes" y "dependiente" es pobre la terminología. Como EdM explica, esta terminología surgió en el contexto de experimentos controlados, donde el investigador podría conjunto de los regresores independientes el uno del otro. Hay muchos preferible términos que no tienen esta cargado de connotación causal, y en mi experiencia, los estadísticos tienden a preferir el más neutral de los términos. Hay muchos otros términos aquí utilizados, incluyendo los siguientes:

$$\begin{matrix} Y_i & & & x_{i,1},...,x_{i,m} \\ \hline \text{Response} & & & \text{Predictors} \\ \text{Regressand} & & & \text{Regressors} \\ \text{Output variable} & & & \text{Input variables} \\ \text{Predicted variable} & & & \text{Explanatory variables} \\ \end{de la matriz}$$

Personalmente, yo uso los términos variables explicativas y la variable de respuesta, ya que esos términos no tienen ninguna connotación de independencia estadística o de control, etc. (Uno podría argumentar que la "respuesta" tiene una connotación causal, pero esto es bastante débil connotación, por lo que no he encontrado que es un problema.)

10voto

g3mini Puntos 101

Para agregar a Frank Harrell y Pedro Flom respuestas:

Estoy de acuerdo en que llamar a una variable "independiente" o "dependiente" es a menudo engañosa. Pero algunas personas todavía. Una vez escuché una respuesta de por qué:

En el análisis de regresión tenemos un "especial" de la variable (usualmente denotado por $Y$) y muchos "no-tan-especial" variables ($X$'s) y queremos ver cómo los cambios en la $X$'s afectar a $Y$. En otras palabras, queremos ver cómo $Y$ depende en $X$'s.

Es por eso $Y$ es llamado "dependiente". Y si uno se llama "dependiente" ¿cómo se llama a otro?

6voto

Zizzencs Puntos 1358

"Dependiente" y "independiente" puede ser confuso términos. Un sentido es pseudo-causal o incluso causal y esto es lo que se quiere decir cuando se dice "variable independiente" y "variable dependiente". Nos referimos a que el DV, en cierto sentido, depende de la IV. Así, por ejemplo, cuando se modela la relación de la altura y el peso en los seres humanos adultos, decimos que el peso es la DV y la altura es la IV.

Esta es la captura de algo que "predictor" no - es decir, la dirección de la relación. Altura predice el peso, pero el peso también predice la altura. Es decir, si a usted le dijeron que adivinar la altura de la gente y les dijo a sus pesos, que sería útil.

Pero no debemos decir que la altura depende del peso.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X