La respuesta breve a su pregunta (como se ha dicho en otro lugar) es que no existe una única definición matemática de la forma de U. El comentario de @whuber es la mejor definición general que he visto.
Hago una investigación sobre las pruebas de las formas de U y para mi presentación tengo una diapositiva con el título "¿Qué significa una U para usted?", lo que significa que es subjetivo lo que la gente entiende por el término "forma de U". Lo más importante es que cuando se utiliza el término "forma de U", se defina exactamente lo que usted sin suponer que los demás sabrán lo que quiere decir. otros sabrán lo que quieres decir.
Como has especificado el caso de un solo regresor, me centraré en él. He visto las siguientes definiciones utilizadas en varios artículos:
- Una forma de U es una cuadrática.
- Una forma de U significa convexidad (para una aplicación en este sentido, véase Van Landeghem's 2012 "A test for the convexity of human well-being over the life cycle: Longitudinal evidence from a 20-year panel").
- Una forma de U es una función con derivada media ponderada negativa hasta un punto, y derivada media ponderada positiva después de ese punto (véase Uri Simonsohn Dos líneas: La primera prueba válida de las relaciones en forma de U ).
- Una forma de U es una función con exactamente un punto de inflexión. Corresponde a una función casi convexa pero no monótona.
Una complicación que surge es ¿qué pasa si el punto de inflexión está cerca de los extremos del rango de la variable x? ¿Debemos seguir considerando esa función como una forma de U? En mi opinión, esta discusión debería tener lugar cuando se define lo que significa una forma de U para su aplicación, y cuando especifique su hipótesis nula. hipótesis nula.
La definición que utilizo en mi documento, Pruebas no paramétricas de relaciones en forma de U es la siguiente:
Dejemos que $m(x)$ sea la función de regresión y que $S\left(X\right)$ sea el soporte de $X$ . Para un conjunto determinado $A_{0}\subset S\left(X\right)$ Estamos interesados en probar lo siguiente:
$$\begin{align*} H_{0}\colon & \exists a\in A_{0}\mbox{ st }\forall x\in S\left(X\right)\\ & m^{'}\left(x\right)\left(x-a\right)\ge0\\ \text{versus}\\H_{A}\colon & \forall a\in A_{0},\,\exists x\in S\left(X\right)\mbox{ st}\\ & m^{'}\left(x\right)\left(x-a\right)<0 \end{align*}$$
Por ejemplo, en una aplicación pruebo una forma de U de la satisfacción vital en la edad de los 20 a los 70 años, donde el punto de inflexión está entre los 30 y los 60 años. Arbitrariamente decisiones son necesarias con este marco propuesto. Lo importante es ser abierto sobre ellas y comprobar la sensibilidad de los resultados a los cambios (y desafiar a otros a hacer lo mismo).
Además de plantear la hipótesis nula, como siempre hay que plantear las suposiciones en las que se basa. Por ejemplo, una suposición común es que el función de regresión tiene forma de U o es monótona. Véase, por ejemplo, el artículo de Lind y Mehlum 2009 "¿Con o sin U? The Appropriate Test for a U-Shaped Relationship", de Lind y Mehlum, 2009. Relationship", en el que proponen una mejora de la prueba cuadrática OLS de vainilla probando que la derivada de una forma funcional especificada forma funcional especificada es negativa al principio del rango y positiva al final.
Un punto adicional a considerar es: ¿Quiere una prueba que rechace la hipótesis nula debido a una pequeña violación de la forma de U? En caso afirmativo, considere el paquete R qmutest que implementa una prueba no paramétrica basada en splines de las hipótesis nulas de que la función de regresión es cuasi-convexa, y por separado que es monótona. Si no quiere una prueba que dé inferencia contra una forma de U por una pequeña violación, la prueba de las dos líneas de Uri podría ser la mejor si quiere probar que una función de regresión es mayormente decreciente y luego mayormente creciente.
Dado que su pregunta era sobre el uso del término "forma de U" y la definición, me parece pertinente enumerar aquí algunos términos que se utilizan a menudo para para referirse a lo mismo que "forma de U" y "forma de U invertida". a: "en forma de valle", "en forma de depresión", "en forma de colina", "unimodal", "con un solo pico" y "con forma de campana". No hay ninguna razón inherente por la que "forma de U" es un término mejor que los demás, pero su uso parece haberse impuesto.
Estoy trabajando en un paquete general de R que sólo será una interfaz para paquetes específicos de R (como qmutest) que comprueban las relaciones en forma de U como sea que ellos decidan definirlas. El objetivo será ayudar a los usuarios a comparar diferentes pruebas y a a los usuarios a comparar diferentes pruebas y a reflexionar sobre la hipótesis nula exacta que quieren probar, y qué hipótesis que quieren probar, y qué suposiciones están dispuestos a hacer.
3 votos
Diferentes autores pueden tener diferentes definiciones: ¿la relación debe ser continua? ¿Diferenciable? ¿Convexa? La definición más general y coherente con la idea de "creciente y luego decreciente" o "decreciente y luego creciente" es: Un mapa $f:A\to\mathbb{R}$ con $A\subset\mathbb{R}$ tiene forma de "U" significa que existe una descomposición de $A=B\cup C$ donde (1) cada elemento de $B$ es menor o igual que cada elemento de $C$ ; (2) $f$ es monótona en ambos $B$ y $C$ (3) las imágenes $f(B)$ y $f(C)$ tienen al menos dos valores cada uno; y (4) las direcciones de monotonicidad de $f$ difieren en $B$ y $C$ .
0 votos
@whuber Esto es exactamente lo que estoy buscando - si hay un acuerdo general sobre cómo definirlo....
2 votos
No podría dar fe de un acuerdo general, y estoy seguro de que muchos autores objetarían que mi definición es más amplia de lo que pretendían. Por eso lo he dejado como comentario.
3 votos
No creo que "en forma de U" sea un término matemáticamente bien definido; no hay una definición universalmente aceptada y no creo que debas buscarla. He cambiado las dos primeras frases de mi respuesta para recalcarlo.