9 votos

¿Qué tipo de regresión a utilizar, teniendo en cuenta una variable con límite superior?

No estoy seguro de qué método utilizar para modelar la relación entre dos variables ( $x$ $y$ ) en el experimento que se describe de la siguiente manera:

  • Hay 3 variables: $x_{aim}$, $x$ y $y$.
  • El valor de $x_{aim}$ cuando se opera el experimento. Sin embargo, $x$ $x_{aim}$ no siempre son iguales.
  • El coeficiente de correlación de Pearson entre el $x_{aim}$ $x$ es de alrededor de 0.9.
  • El coeficiente de correlación de Pearson entre el $x$ $y$ es mucho menor: alrededor de 0.5.
  • $y$ tiene un máximo valor posible ($y_{max}$) que no puede ser excedido.
  • Cada punto de datos se obtiene después de la configuración de $x_{aim}$ y la lectura de $x$$y$.

Aunque el coeficiente de correlación de Pearson entre el $x$ $y$ no es muy grande, se parece a $y$ tiende a aumentar con la $x$.

Después de hacer simples regresiones lineales de $y=f(x)$ $x=g(y)$ (y la conversión de la última vuelta como $g^{-1}$, así como se muestra en la misma gráfica como $f$ por ejemplo), ambas pendientes son positivas, pero la pendiente de $g^{-1}$ es mayor que la de $f$.

¿Tiene sentido decir $x_{max} = f^{-1}(y_{max})$ o $x_{max} = g(y_{max})$? ($x_{max}$ sería alcanzado anteriormente en el segundo caso).

Teniendo en cuenta que $y$ es obligado por $y_{max}$, lo que puede ser dicho sobre el posible valor máximo de $x$ que podría ser alcanzado?

Como tengo entendido, tiene sentido hacer una regresión lineal de la forma $y=f(x)$ al $x$ es la variable independiente y $y$ es la variable dependiente. Sin embargo, en este contexto, no estoy seguro de si tiene sentido considerar que $x$ es independiente y $y$ es dependiente.

Sería un total de mínimos cuadrados de la regresión ser más apropiado? Existen otros métodos para determinar qué valores de $x_{max}$ puede ser alcanzado (y con que probabilidad)?

(Si esto importa, $x$ $y$ no se parecen seguir una distribución normal, a medida que más se han hecho intentos para tratar de alcanzar los mayores valores de $x$.)

4voto

Sean Hanley Puntos 2428

Quiero segunda @del Rey puntos. Es muy intuitivo para sospechar que la regresión $y$ a $x$ ('directo regresión') y de la regresión $x$ a $y$ ("reverse regresión') debe ser el mismo. Sin embargo, esto no es cierto, matemáticamente, ni con respecto a cómo la regresión es la relativa a la situación en la que estamos analizando. Si se hace una gráfica de $y$ sobre el eje vertical de un gráfico y $x$ en el eje horizontal, se puede ver lo que está sucediendo. Directo de regresión de la recta que minimiza las distancias verticales entre los puntos de datos y la línea, mientras que la inversa de regresión minimiza las distancias horizontales. La línea que minimiza el uno sólo minimizar el otro si $r_{xy}=1.0$. Usted necesita decidir lo que se quiere explicar, y lo que usted desea utilizar para explicarlo. La respuesta a esa pregunta te da la variable que se $y$ $x$ y especifica el modelo. Además, (una vez más siguiendo a @Rey), no estoy de acuerdo con tratando de decir $x_{max}=f^{-1}(y_{max})$, por las mismas razones.

Con respecto a la cuestión de una variable limitada, normalmente es concebible que la 'real' cantidad podría ser mayor, pero que simplemente no se puede medir. Por ejemplo, un termómetro exterior de mi ventana, llega hasta los 120, pero podría ser de 140 fuera en algunos lugares, y usted sólo tiene 120 como su medición. Por lo tanto, la variable tendría un límite superior, pero lo que realmente quería pensar que no. Si este es el caso, tobías modelos existen en tales situaciones.

Otro enfoque sería utilizar algo más sólido como loess, que puede ser perfectamente adecuado para sus necesidades.

3voto

x3ja Puntos 169

En primer lugar, creo que no tiene sentido decir $x_{max}=f^{-1}(y_{max})$ aquí, eso es como lo que implica que es un uno-a-uno la función a pesar de $x_{max}$ es explicado por otras variables no observadas.

En segundo lugar, realmente depende del contexto para el que tratar como una variable independiente o dependiente. Desde mi experiencia, a menos que la teoría sugiere fuertemente una forma; de cualquier manera está bien. A partir de sus comentarios en Oct 7, parece como $x$ es el dependiente mientras se $y$ es independiente.

Si es posible, busque en los residuos y a ver si encuentras algo fuera de ella. No podía ser de otra variable que se olvidó, o puede ayudar a transformar las variables.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X