La definición que voy a dar no es exactamente el concepto que quiero, pero es una buena aproximación. No quiero que la definición sea demasiado técnica y específica, porque si existe un nombre estándar para una definición ligeramente diferente, quiero conocerlo.
Sea $(X,\mu)$ sea un espacio de medidas, y sea $\rho$ sea una medida de probabilidad sobre $X$ . Llamo a un subconjunto $A$ de $X$ especial si para todo medible $B\subseteq X$ ,
- $\mu(B)\leq\mu(A)$ implica $\rho(B)\leq\rho(A)$ y
- $\mu(B)=\mu(A)$ y $\rho(B)=\rho(A)$ implica $B=A$ hasta la medida cero (con respecto tanto a $\mu$ y $\rho$ ).
¿Cuál es el nombre estándar de mis conjuntos "especiales"? De forma equivalente, se podría estipular $\mu(A)\leq\beta$ y llame a $A$ "especial" si es esencialmente el maximizador único de $\rho(A)$ dada esa restricción.
También de forma equivalente, podríamos estipular un $\rho$ -medir y considerar conjuntos logrando que $\rho$ -medida que tiene el menor $\mu$ -medida. Esa es probablemente la forma más intuitiva de pensar en esto: buscamos conjuntos que contengan una fracción determinada (heurísticamente: grande) de la masa de $\rho$ pero que sean lo más pequeñas posible (con respecto a $\mu$ ). Parece un concepto completamente natural y obvio, por eso creo que debería tener un nombre estándar. Pero casi no tengo formación en estadística, así que no sé cómo se llama.
Este ejemplo puede ser inverosímil, pero sólo para ilustrarlo: supongamos que el FBI sabe que alguien va a intentar cometer un atentado terrorista en una gran ciudad a una hora determinada. Puede que no sepan dónde, pero pueden tener (alguna estimación de) una distribución de probabilidad para la localización del atentado. Quieren distribuir agentes estratégicamente por toda la ciudad, pero probablemente no tengan suficientes agentes para cubrirla entera. Supongamos que cada agente puede impedir un ataque si se produce dentro de un radio determinado de su posición (lo cual no es realista, ya que el número de agentes cercanos seguramente también importa, pero ignoremos eso); entonces, para maximizar la probabilidad de que se detenga el ataque, en una aproximación, deberían distribuir sus agentes uniformemente sobre un radio de 1,5 km. especial subconjunto del área de la ciudad. Para enfocarlo desde la otra perspectiva, podría darse el caso de que el 99% de la masa de su distribución de probabilidad estuviera contenida en una región con un área muy pequeña. (La de menor área será una especial set). Entonces, para ahorrar recursos, si les parecen bien las probabilidades de 99:1 ( c'est la vie ), es posible que sólo distribuyan un número relativamente pequeño de agentes en esa pequeña región especial.
Si $\rho$ tiene una densidad $f$ con respecto a $\mu$ (cuando tiene sentido hablar de tales), entonces los conjuntos especiales están estrechamente relacionados con los conjuntos de supernivel de $f$ es decir, conjuntos de la forma $\{x:f(x)\geq c\}$ para $c\geq 0$ . (Creo que son básicamente lo mismo, pero la especialidad de $A$ no se ve afectado por el cambio de $A$ por un conjunto de medida cero, por lo que un conjunto de supernivel corresponde en realidad a una clase de equivalencia de conjuntos especiales). Menciono esto aquí porque (1) la conexión con los conjuntos de supernivel es una de mis razones para preocuparme por la especialidad, y (2) "conjuntos de supernivel de la densidad" no es la respuesta que estoy buscando.
Ejemplo 1
He aquí un ejemplo muy sencillo en el que los conjuntos especiales pueden caracterizarse por completo. Sea $X=\{x\_1,\ldots,x\_n\}$ sea un conjunto finito, y sea $\mu$ sea una medida de recuento en $X$ . Sea $\rho$ sea cualquier distribución de probabilidad sobre $X$ que necesariamente tiene una función de densidad $f:X\to\mathbb{R}\_+$ así que por definición.., $f(x\_1) + \ldots + f(x\_n) = 1$ y $\rho(A) = \sum\_{x\in A} f(x)$ . Supongamos que no hay dos puntos que tengan el mismo $f$ -valor; entonces, sin pérdida de generalidad, $f(x\_1) > f(x\_2) > \ldots > f(x\_n)$ . Es fácil ver que los conjuntos especiales en esta configuración son exactamente los conjuntos $A\_k = \{x\_1,x\_2,\ldots,x\_k\}$ es decir, que contengan el mayor $k$ puntos medidos por $\rho$ para $k=0,\ldots,n$ . (Por qué: si tiene algún otro candidato conjunto especial $B$ entonces $A\_{\\#B}$ tiene el mismo $\mu$ -medir como $B$ pero mayor $\rho$ -medida, así $B$ no puede ser especial). Es fácil generalizar este ejemplo al caso en que $f$ no es necesariamente uno a uno: hay que tratar todos los puntos con el mismo $f$ -valor como un bloque: o todos están en el conjunto especial, o ninguno lo está. (De lo contrario, no hay forma de satisfacer la parte de "unicidad" (punto 2) de la definición).
Ejemplo 2
He aquí una generalización del primer ejemplo que espero aclare lo que he dicho más arriba. Sea $(X,\mu)$ sea algún espacio de medidas agradable en el que la integración de funciones tenga sentido (como un colector riemanniano, o simplemente $\mathbb{R}^d$ ). Sea $f:X\to\mathbb{R}\_+$ sea una función integrable no negativa con $\int_X f(x) d\mu = 1$ y que $\rho$ sea la medida de probabilidad $\rho(Y) = \int_Y f(x) d\mu$ Así que $f$ es la densidad de $\rho$ con respecto a $\mu$ . Arreglar algunos $c\geq 0$ y que $A=\{x:f(x)\geq c\}$ .
Reclamación: $A$ es un conjunto especial.
Pruebas: Basta con demostrar que si $\mu(B) = \mu(A)$ entonces $\rho(B)\leq \rho(A)$ con igualdad si y sólo si $B$ y $A$ difieren en un conjunto de medida cero. Si $\mu(B) = \mu(A)$ entonces $\mu(B-A) = \mu(A-B)$ . Ahora escribimos $\begin{align*} \rho(A) - \rho(B) &= \int\_A f(x) d\mu - \int\_B f(x) d\mu \\\\ &= \int\_{A-B} f(x) d\mu - \int\_{B-A} f(x) d\mu \\\\ &= \int\_{A-B} f(x) d\mu - \int\_{A-B}c\\,d\mu - \int\_{B-A} f(x) d\mu + \int\_{B-A}c\\,d\mu\\\\ &= \int\_{A-B} (f(x)-c) d\mu - \int\_{B-A} (f(x)-c) d\mu. \end{align*}$
Por construcción, $f(x) \geq c$ en $A$ y $f(x) < c$ en $B-A$ por lo que la primera integral es no negativa y la segunda integral es no positiva, y de hecho es negativa a menos que $\mu(B-A)=0$ en cuyo caso $\mu(A-B)=0$ también. Así, $\rho(A)-\rho(B)\geq 0$ con desigualdad estricta a menos que $A$ y $B$ difieren en medida cero, QED.