7 votos

¿Cuál es el nombre estándar para los juegos de un tamaño dado con la máxima probabilidad (o un dado, la probabilidad y el tamaño mínimo)?

La definición que le voy a dar no es el concepto que realmente quiero, pero es una buena aproximación. No quiero hacer la definición demasiado técnico y específico, porque si hay un nombre estándar para una definición ligeramente diferente, entonces yo quiero saber acerca de ella.

Deje $(X,\mu)$ ser una medida en el espacio, y deje $\rho$ ser una medida de probabilidad en $X$. Yo llame a un subconjunto $A$ $X$ especial si para todo medible $B\subseteq X$,

  1. $\mu(B)\leq\mu(A)$ implica $\rho(B)\leq\rho(A)$, y
  2. $\mu(B)=\mu(A)$ $\rho(B)=\rho(A)$ implica $B=A$ a medida cero (con respecto a los $\mu$$\rho$).

¿Cuál es el nombre estándar para mi "especial"? Equivalentemente, se podría estipular $\mu(A)\leq\beta$ y llame a $A$ "especial" si es esencialmente el único maximizer de $\rho(A)$ dado que la restricción.

También, equivalentemente, podemos estipular un determinado $\rho$-medir y considerar los conjuntos de lograr ese $\rho$-en la medida que tenga la más pequeña posible, $\mu$- medida. Esa es probablemente la manera más intuitiva para pensar acerca de esto: estamos buscando para los conjuntos que contienen una cierta (de forma heurística: grande) fracción de la masa de $\rho$, pero son tan pequeñas como sea posible (con respecto a $\mu$). Que parece completamente natural y obvio concepto, que es la razón por la que yo pienso que debe tener un nombre estándar. Pero casi no tengo formación en las estadísticas, así que no sé cuál es el nombre.

Este ejemplo puede ser exagerado, pero sólo a manera de ilustración: supongamos que el FBI tiene conocimiento de que alguien va a intentar un ataque terrorista en una cierta ciudad enorme, en una determinada hora. Puede que no sé de dónde, pero que podría tener (algunos estiman de) una distribución de probabilidad para la ubicación del ataque. Quieren distribuir agentes estratégicamente en toda la ciudad, pero probablemente no tengan suficientes agentes para cubrir toda la ciudad. Digamos que cada agente puede evitar un ataque si se produce dentro de un determinado radio de su posición (lo cual es poco realista, ya que el número de agentes cercanos seguramente también importa, pero ignoran que); entonces, para maximizar la probabilidad de que el ataque se detuvo, a una aproximación, deben distribuir sus agentes uniformemente a lo largo de un especial subconjunto del territorio de la ciudad. Para acercarse a esta desde la otra perspectiva, podría darse el caso de que el 99% de la masa de su distribución de probabilidad está contenida en una región con un área muy pequeña. (El uno con el área más pequeña será un especial set). Entonces, para ahorrar recursos, si estás de acuerdo con 99:1 probabilidades (c est la vie), que sólo puede distribuir un número relativamente pequeño de agentes a que las pequeñas especial de la región.

Si $\rho$ tiene una densidad de $f$ con respecto al $\mu$ (en el sentido que tiene hablar de tales), a continuación, conjuntos especiales están estrechamente relacionadas con la superlevel conjuntos de $f$, yo. e., los conjuntos de la forma$\{x:f(x)\geq c\}$$c\geq 0$. (Creo que son básicamente el mismo, pero la particularidad de $A$ no se ve afectado por el cambio de $A$ por un conjunto de medida cero, por lo que un superlevel conjunto en realidad corresponde a una clase de equivalencia de conjuntos especiales.) Menciono esto aquí porque (1) la conexión a superlevel conjuntos es una de mis razones para preocuparse por especialidad, y (2) "superlevel conjuntos de la densidad" no es la respuesta que estoy buscando.


Ejemplo 1

He aquí un ejemplo muy sencillo en el que los juegos especiales puede ser completamente caracterizado. Deje $X=\{x\_1,\ldots,x\_n\}$ ser un conjunto finito, y deje $\mu$ contar medida en $X$. Deje $\rho$ ser cualquier distribución de probabilidad en $X$, lo que necesariamente tiene una función de densidad de $f:X\to\mathbb{R}\_+$, por tanto, por definición, $f(x\_1) + \ldots + f(x\_n) = 1$$\rho(A) = \sum\_{x\in A} f(x)$. Supongamos que no hay dos puntos tienen la misma $f$-valor; entonces, sin pérdida de generalidad, $f(x\_1) > f(x\_2) > \ldots > f(x\_n)$. Es fácil ver que los conjuntos especiales en esta configuración son exactamente los conjuntos de $A\_k = \{x\_1,x\_2,\ldots,x\_k\}$, yo. e., que contienen el mayor $k$ puntos de medida por $\rho$$k=0,\ldots,n$. (Por qué: si usted tiene algún otro candidato conjunto especial $B$, $A\_{\\#B}$ tiene el mismo $\mu$-medida como $B$ pero mayor $\rho$-medida, por lo $B$ no puede ser especial.) Es fácil generalizar este ejemplo, para el caso en que $f$ no es necesariamente de uno a uno: usted tiene que tratar a todos los puntos con el mismo $f$-valor como un bloque: todos ellos están en el set especial, o ninguno de ellos. (De lo contrario, no hay ninguna manera de satisfacer la "singularidad" (punto 2) de la definición).


Ejemplo 2

He aquí una generalización de la primer ejemplo que espero que aclara lo que he dicho anteriormente. Deje $(X,\mu)$ ser agradable medir el espacio en el que la integración de funciones tiene sentido (como un colector de Riemann, o sólo $\mathbb{R}^d$). Deje $f:X\to\mathbb{R}\_+$ ser no negativo función integrable con $\int_X f(x) d\mu = 1$, y deje $\rho$ la probabilidad de medida $\rho(Y) = \int_Y f(x) d\mu$, lo $f$ es la densidad de $\rho$ con respecto al $\mu$. Corregir algunos $c\geq 0$ y deje $A=\{x:f(x)\geq c\}$.

Reclamo: $A$ es un juego especial.

Prueba: basta demostrar que si $\mu(B) = \mu(A)$,$\rho(B)\leq \rho(A)$, con igualdad si y sólo si $B$ $A$ diferir por un conjunto de medida cero. Si $\mu(B) = \mu(A)$,$\mu(B-A) = \mu(A-B)$. Ahora podemos escribir $\begin{align*} \rho(A) - \rho(B) &= \int\_A f(x) d\mu - \int\_B f(x) d\mu \\\\ &= \int\_{A-B} f(x) d\mu - \int\_{B-A} f(x) d\mu \\\\ &= \int\_{A-B} f(x) d\mu - \int\_{A-B}c\\,d\mu - \int\_{B-A} f(x) d\mu + \int\_{B-A}c\\,d\mu\\\\ &= \int\_{A-B} (f(x)-c) d\mu - \int\_{B-A} (f(x)-c) d\mu. \end{align*}$

Por construcción, $f(x) \geq c$$A$$f(x) < c$$B-A$, por lo que la primera integral es no negativa y la segunda integral es el valor no positivo, y es en realidad negativa, a menos que $\mu(B-A)=0$, en cuyo caso $\mu(A-B)=0$. Por lo tanto, $\rho(A)-\rho(B)\geq 0$, con desigualdad estricta a menos que $A$ $B$ se diferencian por la medida cero, QED.

3voto

Helixso Puntos 65

En las estadísticas, especialmente la estadística Bayesiana, lo que se busca es la llamado el HPD-región de o "el más posterior de la densidad de la región", que está destinado a ser un conjunto con volumen mínimo para una determinada (grande) (posterior) de probabilidad.

3voto

DreamSonic Puntos 1147

Una similar (equivalente?) problema en estadística.

No estoy seguro sobre el nombre, pero debe ser algo como "crítico área de decisión". Esto surge de forma natural en el problema de la hipótesis la prueba de hipótesis simple donde el problema de optimización es:

$$ \sup_{ A \in \mathcal{A}\; \mu(A)\leq \beta } \rho(A)$$

Cómo este problema se ha resuelto

Una más conveniente establecer para la optimización (que el conjunto de la función de indicador de set) es : $$\Psi= (\psi: X\rightarrow [0,1]\;\; measurable )$$ (que es más conveniente, porque convexo) El problema se reformula como:

$$ \sup_{ \psi\in \Psi\; \int_{X} \psi d \mu \leq \beta } \int \psi d\rho=\sup_{\psi\in \Psi}\inf_{t\in [0,\infty]}\mathcal{L}(t,\psi)$$

donde $\mathcal{L}(t,\psi)$ es el Lagrangien de la que se considera problema de optimización:

$$ \mathcal{L}(t,\psi)=\int\psi d\rho - t\left (\int\psi d\mu-\beta \right )=t\beta\int \psi (d\rho-td\mu). $$

Si usted puede utilizar un mín-máx teorema (bajo algunas adecuado topológica de la asunción, no restrictiva) para volver inf y sup, y si $\rho$ es absolutamente continua con respecto a $\mu$, el minimizer del problema de optimización está dada por la tan famosa Neymann test de Pearson:

$$\psi^*= 1_{\frac{d\rho}{d\mu}\geq t(\beta)}$$

(sigue para encontrar $t(\beta)$...) Esto se llama una prueba porque puede ayudar a usted a prueba si la legislación de una variable aleatoria $X$ $\mu$ o $\rho$ dada una observación de $X$. Si $\rho$ no es absolutamente continua con respecto a $\mu$ se puede descomponer $\rho$ (por el Teorema de Lebesgue) y aplicar la misma metodología.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X