No estoy seguro de qué método utilizar para modelar la relación entre dos variables ( $x$ $y$ ) en el experimento que se describe de la siguiente manera:
- Hay 3 variables: $x_{aim}$, $x$ y $y$.
- El valor de $x_{aim}$ cuando se opera el experimento. Sin embargo, $x$ $x_{aim}$ no siempre son iguales.
- El coeficiente de correlación de Pearson entre el $x_{aim}$ $x$ es de alrededor de 0.9.
- El coeficiente de correlación de Pearson entre el $x$ $y$ es mucho menor: alrededor de 0.5.
- $y$ tiene un máximo valor posible ($y_{max}$) que no puede ser excedido.
- Cada punto de datos se obtiene después de la configuración de $x_{aim}$ y la lectura de $x$$y$.
Aunque el coeficiente de correlación de Pearson entre el $x$ $y$ no es muy grande, se parece a $y$ tiende a aumentar con la $x$.
Después de hacer simples regresiones lineales de $y=f(x)$ $x=g(y)$ (y la conversión de la última vuelta como $g^{-1}$, así como se muestra en la misma gráfica como $f$ por ejemplo), ambas pendientes son positivas, pero la pendiente de $g^{-1}$ es mayor que la de $f$.
¿Tiene sentido decir $x_{max} = f^{-1}(y_{max})$ o $x_{max} = g(y_{max})$? ($x_{max}$ sería alcanzado anteriormente en el segundo caso).
Teniendo en cuenta que $y$ es obligado por $y_{max}$, lo que puede ser dicho sobre el posible valor máximo de $x$ que podría ser alcanzado?
Como tengo entendido, tiene sentido hacer una regresión lineal de la forma $y=f(x)$ al $x$ es la variable independiente y $y$ es la variable dependiente. Sin embargo, en este contexto, no estoy seguro de si tiene sentido considerar que $x$ es independiente y $y$ es dependiente.
Sería un total de mínimos cuadrados de la regresión ser más apropiado? Existen otros métodos para determinar qué valores de $x_{max}$ puede ser alcanzado (y con que probabilidad)?
(Si esto importa, $x$ $y$ no se parecen seguir una distribución normal, a medida que más se han hecho intentos para tratar de alcanzar los mayores valores de $x$.)