Hace poco encontré en un artículo la mención de las estadísticas de tipo U de primer y segundo orden sin más detalles.
¿Alguien sabe qué son las estadísticas del tipo U?
Las referencias serán muy apreciadas.
Hace poco encontré en un artículo la mención de las estadísticas de tipo U de primer y segundo orden sin más detalles.
¿Alguien sabe qué son las estadísticas del tipo U?
Las referencias serán muy apreciadas.
De los comentarios y de la respuesta he sacado que "U-type statistics" es la jerga de "U-statistics".
Aquí hay un par de elementos tomados de la referencia proporcionada por @cardinal, y en la respuesta anterior. Una estadística U de grado o pedir $r$ se basa en una función de núcleo simétrico de permutación $h$ de aridad $r$
$$ h(x_1, ..., x_r): \mathbb{X}^r \rightarrow \mathbb{R}, $$
y es la media de esa función tomada sobre todos los posibles subconjuntos de observaciones de la muestra. Más formalmente
$$ U = \frac{1}{\left( \array{n\\r} \right)} \sum_{\Pi_r(n)}h(x_{\pi_1}, ..., x_{\pi_r}), $$
donde la suma se toma sobre $\Pi_r$ el conjunto de todos los subconjuntos desordenados elegidos entre $\{1, ..., n\}$ . El interés de las estadísticas U es que son asintóticamente gaussianas siempre que $E \{ h^2(X_1, ..., X_r) \} < \infty$ .
Ejemplo 1: La media de la muestra es una estadística U de primer orden con $h(x) = x$ .
Ejemplo 2: El estadístico de rango con signo es un estadístico U de segundo orden con $h(x_1, x_2) = 1_{\mathbb{R}^+}(x_1+x_2)$ (la función que es igual a $1$ si $x_1 + x_2 > 0$ y $0$ en caso contrario).
$$ U = \frac{1}{\left( \array{n\\2} \right)} \sum_{i=1}^{n-1} \sum_{j=i+1}^n 1_{\mathbb{R}^+}(x_i+x_i) $$
es la suma de los pares $(x_i, x_j)$ de la muestra con suma positiva $x_i+x_j > 0$ y puede utilizarse como estadística de prueba para investigar si la distribución de las observaciones se sitúa en 0.
Ejemplo 3: El espacio de definición de la unidad $\mathbb{X}$ de $h$ no tiene por qué ser real. Kendall's $\tau$ es una estadística U de segundo orden con $\frac{1}{2} h((x_1, y_1), (x_2, y_2)) = 1_{\mathbb{R}^+}((y_2-y_1)(x_2-x_1)) - 1$ .
$$ \tau = \frac{2}{\left( \array{n\\2} \right)} \sum_{i=1}^{n-1} \sum_{j=i+1}^n 1_{\mathbb{R}^+}((y_2-y_1)(x_2-x_1)) - 1 $$
es una medida de dependencia entre $X$ y $Y$ y cuenta el número de pares concordantes $(x_i, y_i)$ y $(x_j, y_j)$ en las observaciones.
Hemos establecido que las estadísticas U son lo que el PO está buscando. Voy a responder a su segunda pregunta sobre el origen de las estadísticas U. La teoría de la estadística U se puede encontrar en muchos libros sobre no paramétrica y estoy seguro de que también en las diversas enciclopedias de estadística. Aquí hay un buen artículo de Tom Ferguson que resume la teoría. Creo que en realidad es un tutorial de clase sobre ella. Esto es lo que dice sobre el orden. El resto lo puedes encontrar en el artículo
5. Degeneración . Cuando se utiliza la estadística U para contrastar hipótesis, a veces ocurre que, en la hipótesis nula, la distribución asintótica tiene varianza cero. ocurre que en la hipótesis nula, la distribución asintótica tiene varianza cero. Este es un caso degenerado, y no podemos utilizar el Teorema 2 para encontrar puntos de corte aproximados. La definición general de degeneración para un estadístico U de orden $m$ y desviaciones, $\sigma_1^2 \leq \sigma_2^2 \leq ... \leq \sigma_m^2$ dada por (19) es la siguiente. Definición 3. Decimos que un estadístico U tiene una degeneración de orden $k$ si $\sigma_1^2 = · · · = \sigma_k^2 = 0$ y $\sigma^2_{k+1} > 0$ .
I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.