7 votos

¿Cuál es la definición estricta de relación en forma de U?

Ahora he visto varios trabajos que analizan las relaciones en forma de U o en forma de U inversa entre variables (en un marco de regresión). El entendimiento general que tengo de ahí es que se trata de un tipo específico de relación no lineal que todos podemos visualizar fácilmente.

Sin embargo, estoy un poco confundido sobre cómo se definen exactamente las funciones de regresión en forma de U. Supongamos, para simplificar, que sólo hay un regresor $x$ .

¿Tener una función de regresión en forma de U significa que la función de regresión es convexa y decreciente en $x$ hasta cierto punto $c$ y después $c$ es convexo y creciente en $x$ ?

¿O simplemente significa que la función de regresión es decreciente en $x$ hasta cierto punto $c$ y después $c$ está aumentando en $x$ ?

3 votos

Diferentes autores pueden tener diferentes definiciones: ¿la relación debe ser continua? ¿Diferenciable? ¿Convexa? La definición más general y coherente con la idea de "creciente y luego decreciente" o "decreciente y luego creciente" es: Un mapa $f:A\to\mathbb{R}$ con $A\subset\mathbb{R}$ tiene forma de "U" significa que existe una descomposición de $A=B\cup C$ donde (1) cada elemento de $B$ es menor o igual que cada elemento de $C$ ; (2) $f$ es monótona en ambos $B$ y $C$ (3) las imágenes $f(B)$ y $f(C)$ tienen al menos dos valores cada uno; y (4) las direcciones de monotonicidad de $f$ difieren en $B$ y $C$ .

0 votos

@whuber Esto es exactamente lo que estoy buscando - si hay un acuerdo general sobre cómo definirlo....

2 votos

No podría dar fe de un acuerdo general, y estoy seguro de que muchos autores objetarían que mi definición es más amplia de lo que pretendían. Por eso lo he dejado como comentario.

8voto

Martin Puntos 36

La respuesta breve a su pregunta (como se ha dicho en otro lugar) es que no existe una única definición matemática de la forma de U. El comentario de @whuber es la mejor definición general que he visto.

Hago una investigación sobre las pruebas de las formas de U y para mi presentación tengo una diapositiva con el título "¿Qué significa una U para usted?", lo que significa que es subjetivo lo que la gente entiende por el término "forma de U". Lo más importante es que cuando se utiliza el término "forma de U", se defina exactamente lo que usted sin suponer que los demás sabrán lo que quiere decir. otros sabrán lo que quieres decir.

Como has especificado el caso de un solo regresor, me centraré en él. He visto las siguientes definiciones utilizadas en varios artículos:

  • Una forma de U es una cuadrática.
  • Una forma de U significa convexidad (para una aplicación en este sentido, véase Van Landeghem's 2012 "A test for the convexity of human well-being over the life cycle: Longitudinal evidence from a 20-year panel").
  • Una forma de U es una función con derivada media ponderada negativa hasta un punto, y derivada media ponderada positiva después de ese punto (véase Uri Simonsohn Dos líneas: La primera prueba válida de las relaciones en forma de U ).
  • Una forma de U es una función con exactamente un punto de inflexión. Corresponde a una función casi convexa pero no monótona.

Una complicación que surge es ¿qué pasa si el punto de inflexión está cerca de los extremos del rango de la variable x? ¿Debemos seguir considerando esa función como una forma de U? En mi opinión, esta discusión debería tener lugar cuando se define lo que significa una forma de U para su aplicación, y cuando especifique su hipótesis nula. hipótesis nula.

La definición que utilizo en mi documento, Pruebas no paramétricas de relaciones en forma de U es la siguiente:

Dejemos que $m(x)$ sea la función de regresión y que $S\left(X\right)$ sea el soporte de $X$ . Para un conjunto determinado $A_{0}\subset S\left(X\right)$ Estamos interesados en probar lo siguiente:

$$\begin{align*} H_{0}\colon & \exists a\in A_{0}\mbox{ st }\forall x\in S\left(X\right)\\ & m^{'}\left(x\right)\left(x-a\right)\ge0\\ \text{versus}\\H_{A}\colon & \forall a\in A_{0},\,\exists x\in S\left(X\right)\mbox{ st}\\ & m^{'}\left(x\right)\left(x-a\right)<0 \end{align*}$$

Por ejemplo, en una aplicación pruebo una forma de U de la satisfacción vital en la edad de los 20 a los 70 años, donde el punto de inflexión está entre los 30 y los 60 años. Arbitrariamente decisiones son necesarias con este marco propuesto. Lo importante es ser abierto sobre ellas y comprobar la sensibilidad de los resultados a los cambios (y desafiar a otros a hacer lo mismo).

Además de plantear la hipótesis nula, como siempre hay que plantear las suposiciones en las que se basa. Por ejemplo, una suposición común es que el función de regresión tiene forma de U o es monótona. Véase, por ejemplo, el artículo de Lind y Mehlum 2009 "¿Con o sin U? The Appropriate Test for a U-Shaped Relationship", de Lind y Mehlum, 2009. Relationship", en el que proponen una mejora de la prueba cuadrática OLS de vainilla probando que la derivada de una forma funcional especificada forma funcional especificada es negativa al principio del rango y positiva al final.

Un punto adicional a considerar es: ¿Quiere una prueba que rechace la hipótesis nula debido a una pequeña violación de la forma de U? En caso afirmativo, considere el paquete R qmutest que implementa una prueba no paramétrica basada en splines de las hipótesis nulas de que la función de regresión es cuasi-convexa, y por separado que es monótona. Si no quiere una prueba que dé inferencia contra una forma de U por una pequeña violación, la prueba de las dos líneas de Uri podría ser la mejor si quiere probar que una función de regresión es mayormente decreciente y luego mayormente creciente.

Dado que su pregunta era sobre el uso del término "forma de U" y la definición, me parece pertinente enumerar aquí algunos términos que se utilizan a menudo para para referirse a lo mismo que "forma de U" y "forma de U invertida". a: "en forma de valle", "en forma de depresión", "en forma de colina", "unimodal", "con un solo pico" y "con forma de campana". No hay ninguna razón inherente por la que "forma de U" es un término mejor que los demás, pero su uso parece haberse impuesto.

Estoy trabajando en un paquete general de R que sólo será una interfaz para paquetes específicos de R (como qmutest) que comprueban las relaciones en forma de U como sea que ellos decidan definirlas. El objetivo será ayudar a los usuarios a comparar diferentes pruebas y a a los usuarios a comparar diferentes pruebas y a reflexionar sobre la hipótesis nula exacta que quieren probar, y qué hipótesis que quieren probar, y qué suposiciones están dispuestos a hacer.

1 votos

+1. Estoy un poco confundido por esta frase: "¿Quiere una prueba que rechace la hipótesis nula debido a una pequeña violación de la forma de U?" Asumo que la nula es que no hay forma de U, por lo que un valor p suficientemente pequeño era una evidencia de la forma de U, ¿es correcto?

1 votos

(Me alegra ver que mencionas favorablemente el artículo de Uri: Lo mencioné en mi respuesta aquí y fue muy criticado en los comentarios).

0 votos

@amoeba los nulos del paquete qmutest son la cuasi-convexidad y la monotonicidad (correspondientes a las funciones R cbquasi y cbmono ). Combinadas, las pruebas dan una inferencia sobre las formas de U. De hecho, esto es diferente de la especificación cuadrática de OLS y de la prueba de dos líneas de Uri. He realizado ediciones para añadir información sobre las hipótesis nulas.

7voto

zowens Puntos 1417

"Relación en forma de U" no es un término matemáticamente preciso y no existe una definición universalmente aceptada. Es normalmente significa que la relación es primero decreciente y luego creciente, o viceversa.

En otras palabras, significa que la relación no es monótona (no monótona), sino que tiene exactamente un extremo (máximo o mínimo). En informática esto es a veces llamado "bitónico" .

Uri Simonsohn ha escrito recientemente un interesante artículo sobre la comprobación de las relaciones en forma de U. Véase su preimpresión Dos líneas: Una alternativa válida a la prueba inválida de las relaciones en forma de U con regresiones cuadráticas que es muy legible y divertido. Así es como empieza el artículo:

¿Existen demasiadas opciones, virtudes o ejemplos en una frase inicial? frase inicial? Los investigadores suelen interesarse por este tipo de preguntas, para evaluar si el efecto de $x$ en $y$ es positivo para valores bajos de $x$ pero negativo para valores altos de $x$ . Para facilitar la exposición, me refiero a todas las de estas relaciones como "en forma de U", tanto si son simétricas como si no lo son (es decir, en forma de U o de J), y si el efecto de la simétricas o no (es decir, en forma de U o de J), y si el efecto de $x$ en $y$ pasa de negativo a positivo o viceversa (es decir, U o U invertida).

Esto apoya la definición que he dado anteriormente.


Para un breve resumen del trabajo de Uri, se puede leer su post en DataColada Dos líneas: La primera prueba válida de las relaciones en forma de U . El punto principal es que el uso de la regresión cuadrática para probar la presencia de una relación en forma de U es muy muy equivocado. Al parecer, los ajustes cuadráticos se utilizan a menudo en algunos campos para argumentar a favor de una relación en forma de U (es decir, la prueba t para el término cuadrático se considera la prueba de la forma de U); esto es preocupante.

Esta es la cifra clave:

U-shaped relationships

Actualización: Hay algunas críticas al artículo de Uri en los comentarios. Me gustaría destacar que él nunca sugiere que los ajustes discontinuos de dos líneas se supone que modelan bien los datos (o que el salto en la discontinuidad tiene algún significado físico). No. Este ajuste se utiliza para el único propósito de proporcionar una prueba estadística de la forma de la U.

Por supuesto, estoy de acuerdo con @FrankHarrell en que tiene mucho más sentido utilizar un modelo spline para ajustar esas relaciones no lineales. Pero los splines no proporcionan una prueba de la forma de U, mientras que el ajuste de dos líneas de Uri sí lo hace.

4 votos

Yo diría que una curva cuadrática apunta, en primer lugar, a una pendiente variable. Lo cual creo que es una forma muy muy buena (o al menos fácil, en muchas circunstancias) de comprobarlo. Sin embargo, es una muy mala manera de representar la (verdadera) relación subyacente, especialmente la, si se puede decir, U-ness de una relación.

1 votos

Mi punto matiza el mal comportamiento de los ajustes cuadráticos. Al final, por algún cambio de variables, podríamos hacer que cualquier relación "L" se convierta en forma de "U". Esto no hace que la crítica sobre el lenguaje descuidado sobre las relaciones en forma de U y los ajustes cuadráticos relacionados (simétricos) sea menos descuidada. Sin embargo, puede decir que la crítica a las conclusiones (ciertamente ridículas) puede ser a veces pedante. En el caso de las dos imágenes de Sterling y Swaab, la forma de U puede ser ridícula, y estrictamente hablando hay más bien una forma de L/J, sin embargo la forma de U transmite la historia a los no profesionales.

1 votos

Los ajustes de dos líneas en sus ejemplos ni siquiera tienen continuidad de orden cero, lo que es casi imposible en las relaciones reales entre variables continuas. El ajuste cuadrático parece ser mejor que el D. Pero todo esto es por lo que utilizamos splines de regresión para ajustar relaciones suaves; relajan los supuestos de las formas cuadráticas.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X