7 votos

Prueba de límite o umbral para el gráfico de dispersión de tipo de regresión

Estoy buscando una manera de probar si un límite de umbral existe en una respuesta fisiológica – una muestra de los datos se grafican a continuación. Mi hipótesis es que la X-variable impone una restricción fisiológica en valores, produciendo así un límite 'techo' para el máximo de los valores de Y que disminuye a mayores valores de X (indicado por la línea roja en la figura). Asumo ninguna Y-valores por debajo del límite están limitados por algún otro factor no incluido en este modelo.

Esencialmente, mi objetivo es determinar si el límite existe y si es así obtener un intervalo de confianza para la línea de límite de la modelo – similar a un modelo de regresión lineal, sino que describe el límite superior de los valores, en lugar de en el centro de la masa.

Estoy seguro de que algo como esto existe, pero no he venido a través de ella antes de. También, agradecería cualquier sugerencia sobre un mejor título o etiquetas para este post – supongo hay términos más precisos de lo que estoy describiendo que podría ayudar a las personas a encontrar este post.

threshold

3voto

AdamSane Puntos 1825

Tal patrón a menudo se producen cuando no hay ningún "límite" en realidad existe.

Aquí puedo generar X e y como independiente de derecha sesgo aleatorio de variables, sin embargo, este patrón se produce:

enter image description here

La impresión de cualquier sentido de un límite en mi parcela es completamente falso, sin embargo, su apariencia es muy similar a la tuya. (Hay una real vertical límite en este bivariante de distribución en $x=80$, pero podría generar muy parecidas parcelas sin límites a todos.)

Aquí está el código que he usado para generar la trama (en R):

x = rbeta(1000,1,10)*80
y = rbeta(1000,1,3)/1.5+.3
plot(x,y,ylim=c(0,1))

Intentando un par de veces más parece que alrededor de un tercio del tiempo que se le da a una trama que parece tener una inclinación de la frontera.

Sin duda, un poco de tocar el violín con distribuciones podría mejorar la proporción de veces que se produce y al mismo tiempo hacer que se vea aún más gusta de tu foto (esta desplazado/a escala de la beta(1,10)$\times$beta(1,3) fue el primer contraejemplo he intentado).

Dada mi foto en realidad no tiene ningún límite de ahí, uno debe tener cuidado con la interpretación de un patrón. Sería necesario una caracterización de lo que lo hace un límite que no se generan gran cantidad de falsos positivos en ejemplos como el que me das.

0voto

vahid Puntos 9

Mi intención en cómo este problema puede ser resuelto es:

  1. Calcular modelo lineal para recibir la línea de regresión $r$.
  2. Calcular el vector normal $v$ a la resultante de la regresión de la línea.
  3. Cambio $r$ $v$ hasta todos los puntos de datos en $r$.

Para optimizar $r$, usted podría rotar por cierto ángulo $\alpha$ y parada para el mejor $\alpha$ que se encuentra, tal vez mediante la Suma de Cuadrados Residual como término de referencia.

Como he tratado de mostrar en esta figura:

enter image description here

Otro enfoque podría ser la utilización de máquinas de Vectores Soporte. No sé si esto es posible con los datos, pero tal vez puede producir algún pardillo puntos situados por encima de los datos y dividirlos de los originales de puntos usando una SVM. Esto es sólo una idea que se me ocurrió. Aunque, prefiero el primer método.

0voto

bj292 Puntos 11

Comenzaría por encontrar el "sobre superior" de sus datos y luego representar el "sobre" como una línea recta o una función lineal por partes.

Para empezar, podrías estimar la "envoltura" como una función constante a destajo f (x) = max (yk, dado que abs (x-xk) está debajo de delta), donde delta es un parámetro, por ejemplo 3 y (xk, yk) son tus puntos de datos. Dibujar una línea recta a través de los puntos (xk, f (xk)) debe ser sencillo :)

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X