7 votos

¿Cuál es el nombre estándar de los conjuntos de un tamaño dado con probabilidad máxima (o de una probabilidad dada y tamaño mínimo)?

La definición que voy a dar no es exactamente el concepto que quiero, pero es una buena aproximación. No quiero que la definición sea demasiado técnica y específica, porque si existe un nombre estándar para una definición ligeramente diferente, quiero conocerlo.

Sea $(X,\mu)$ sea un espacio de medidas, y sea $\rho$ sea una medida de probabilidad sobre $X$ . Llamo a un subconjunto $A$ de $X$ especial si para todo medible $B\subseteq X$ ,

  1. $\mu(B)\leq\mu(A)$ implica $\rho(B)\leq\rho(A)$ y
  2. $\mu(B)=\mu(A)$ y $\rho(B)=\rho(A)$ implica $B=A$ hasta la medida cero (con respecto tanto a $\mu$ y $\rho$ ).

¿Cuál es el nombre estándar de mis conjuntos "especiales"? De forma equivalente, se podría estipular $\mu(A)\leq\beta$ y llame a $A$ "especial" si es esencialmente el maximizador único de $\rho(A)$ dada esa restricción.

También de forma equivalente, podríamos estipular un $\rho$ -medir y considerar conjuntos logrando que $\rho$ -medida que tiene el menor $\mu$ -medida. Esa es probablemente la forma más intuitiva de pensar en esto: buscamos conjuntos que contengan una fracción determinada (heurísticamente: grande) de la masa de $\rho$ pero que sean lo más pequeñas posible (con respecto a $\mu$ ). Parece un concepto completamente natural y obvio, por eso creo que debería tener un nombre estándar. Pero casi no tengo formación en estadística, así que no sé cómo se llama.

Este ejemplo puede ser inverosímil, pero sólo para ilustrarlo: supongamos que el FBI sabe que alguien va a intentar cometer un atentado terrorista en una gran ciudad a una hora determinada. Puede que no sepan dónde, pero pueden tener (alguna estimación de) una distribución de probabilidad para la localización del atentado. Quieren distribuir agentes estratégicamente por toda la ciudad, pero probablemente no tengan suficientes agentes para cubrirla entera. Supongamos que cada agente puede impedir un ataque si se produce dentro de un radio determinado de su posición (lo cual no es realista, ya que el número de agentes cercanos seguramente también importa, pero ignoremos eso); entonces, para maximizar la probabilidad de que se detenga el ataque, en una aproximación, deberían distribuir sus agentes uniformemente sobre un radio de 1,5 km. especial subconjunto del área de la ciudad. Para enfocarlo desde la otra perspectiva, podría darse el caso de que el 99% de la masa de su distribución de probabilidad estuviera contenida en una región con un área muy pequeña. (La de menor área será una especial set). Entonces, para ahorrar recursos, si les parecen bien las probabilidades de 99:1 ( c'est la vie ), es posible que sólo distribuyan un número relativamente pequeño de agentes en esa pequeña región especial.

Si $\rho$ tiene una densidad $f$ con respecto a $\mu$ (cuando tiene sentido hablar de tales), entonces los conjuntos especiales están estrechamente relacionados con los conjuntos de supernivel de $f$ es decir, conjuntos de la forma $\{x:f(x)\geq c\}$ para $c\geq 0$ . (Creo que son básicamente lo mismo, pero la especialidad de $A$ no se ve afectado por el cambio de $A$ por un conjunto de medida cero, por lo que un conjunto de supernivel corresponde en realidad a una clase de equivalencia de conjuntos especiales). Menciono esto aquí porque (1) la conexión con los conjuntos de supernivel es una de mis razones para preocuparme por la especialidad, y (2) "conjuntos de supernivel de la densidad" no es la respuesta que estoy buscando.


Ejemplo 1

He aquí un ejemplo muy sencillo en el que los conjuntos especiales pueden caracterizarse por completo. Sea $X=\{x\_1,\ldots,x\_n\}$ sea un conjunto finito, y sea $\mu$ sea una medida de recuento en $X$ . Sea $\rho$ sea cualquier distribución de probabilidad sobre $X$ que necesariamente tiene una función de densidad $f:X\to\mathbb{R}\_+$ así que por definición.., $f(x\_1) + \ldots + f(x\_n) = 1$ y $\rho(A) = \sum\_{x\in A} f(x)$ . Supongamos que no hay dos puntos que tengan el mismo $f$ -valor; entonces, sin pérdida de generalidad, $f(x\_1) > f(x\_2) > \ldots > f(x\_n)$ . Es fácil ver que los conjuntos especiales en esta configuración son exactamente los conjuntos $A\_k = \{x\_1,x\_2,\ldots,x\_k\}$ es decir, que contengan el mayor $k$ puntos medidos por $\rho$ para $k=0,\ldots,n$ . (Por qué: si tiene algún otro candidato conjunto especial $B$ entonces $A\_{\\#B}$ tiene el mismo $\mu$ -medir como $B$ pero mayor $\rho$ -medida, así $B$ no puede ser especial). Es fácil generalizar este ejemplo al caso en que $f$ no es necesariamente uno a uno: hay que tratar todos los puntos con el mismo $f$ -valor como un bloque: o todos están en el conjunto especial, o ninguno lo está. (De lo contrario, no hay forma de satisfacer la parte de "unicidad" (punto 2) de la definición).


Ejemplo 2

He aquí una generalización del primer ejemplo que espero aclare lo que he dicho más arriba. Sea $(X,\mu)$ sea algún espacio de medidas agradable en el que la integración de funciones tenga sentido (como un colector riemanniano, o simplemente $\mathbb{R}^d$ ). Sea $f:X\to\mathbb{R}\_+$ sea una función integrable no negativa con $\int_X f(x) d\mu = 1$ y que $\rho$ sea la medida de probabilidad $\rho(Y) = \int_Y f(x) d\mu$ Así que $f$ es la densidad de $\rho$ con respecto a $\mu$ . Arreglar algunos $c\geq 0$ y que $A=\{x:f(x)\geq c\}$ .

Reclamación: $A$ es un conjunto especial.

Pruebas: Basta con demostrar que si $\mu(B) = \mu(A)$ entonces $\rho(B)\leq \rho(A)$ con igualdad si y sólo si $B$ y $A$ difieren en un conjunto de medida cero. Si $\mu(B) = \mu(A)$ entonces $\mu(B-A) = \mu(A-B)$ . Ahora escribimos $\begin{align*} \rho(A) - \rho(B) &= \int\_A f(x) d\mu - \int\_B f(x) d\mu \\\\ &= \int\_{A-B} f(x) d\mu - \int\_{B-A} f(x) d\mu \\\\ &= \int\_{A-B} f(x) d\mu - \int\_{A-B}c\\,d\mu - \int\_{B-A} f(x) d\mu + \int\_{B-A}c\\,d\mu\\\\ &= \int\_{A-B} (f(x)-c) d\mu - \int\_{B-A} (f(x)-c) d\mu. \end{align*}$

Por construcción, $f(x) \geq c$ en $A$ y $f(x) < c$ en $B-A$ por lo que la primera integral es no negativa y la segunda integral es no positiva, y de hecho es negativa a menos que $\mu(B-A)=0$ en cuyo caso $\mu(A-B)=0$ también. Así, $\rho(A)-\rho(B)\geq 0$ con desigualdad estricta a menos que $A$ y $B$ difieren en medida cero, QED.

5voto

Helixso Puntos 65

En estadística, especialmente en estadística bayesiana, lo que se busca es HPD-región o "región de mayor densidad posterior", que se entiende como un conjunto con volumen mínimo para una probabilidad (posterior) dada (grande).

3voto

DreamSonic Puntos 1147

Un problema similar (¿equivalente?) en estadística.

No estoy seguro del nombre, pero debería ser algo así como " área de decisión crítica ". Esto surge naturalmente en el problema de comprobación de hipótesis de hipótesis simple donde se encuentra el problema de optimización:

$$ \sup_{ A \in \mathcal{A}\; \mu(A)\leq \beta } \rho(A)$$

Cómo se resuelve este problema

Un conjunto más conveniente para la optimización (que el conjunto de la función indicadora de conjunto) es : $$\Psi= (\psi: X\rightarrow [0,1]\;\; measurable )$$ (es más conveniente porque es convexo) El problema se reformula como

$$ \sup_{ \psi\in \Psi\; \int_{X} \psi d \mu \leq \beta } \int \psi d\rho=\sup_{\psi\in \Psi}\inf_{t\in [0,\infty]}\mathcal{L}(t,\psi)$$

donde $\mathcal{L}(t,\psi)$ es el Lagrangien del problema de optimización considerado:

$$ \mathcal{L}(t,\psi)=\int\psi d\rho- t\left (\int\psi d\mu-\beta \right )=t\beta-\int \psi (d\rho-td\mu). $$

Si puede utilizar un teorema minmax (bajo algún supuesto topológico adecuado, no restrictivo) para revertir inf y sup, y si $\rho$ es absolutamente continua con respecto a $\mu$ el minimizador del problema de optimización viene dado por el famoso test de Neymann Pearson:

$$\psi^*= 1_{\frac{d\rho}{d\mu}\geq t(\beta)}$$

(queda por encontrar $t(\beta)$ ...) Se denomina prueba porque puede ayudar a comprobar si la ley de una variable aleatoria $X$ es $\mu$ o $\rho$ dada una observación de $X$ . Si $\rho$ no es absolutamente continua con respecto a $\mu$ se puede descomponer $\rho$ (por el Teorema de Lebesgue) y aplicar la misma metodología.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X