9 votos

Confusiones sobre la derivada de Radon-Nikodym y las medidas dominantes

Tengo algunas dificultades para entender la derivada de Radon-Nikodym y vincularla a la forma ordinaria de obtener la función de densidad de probabilidad, que es a través de la derivada de la función de distribución acumulativa (f.d.c.). ¿Cómo se puede relacionar intuitivamente la derivada de Radon-Nikodym con la definición teórica no medida de la función de densidad de probabilidad?

Creo que debo ser más claro. Si tenemos una f.d.c. entonces aunque sea discontinua, se puede tomar la derivada y en los puntos discontinuos tenemos funciones de dirac. ¿Cómo se puede ver esto desde el punto de vista de la derivada de Radon-Nikodym? Es posible que la f.d.c. no sea diferenciable en casi ningún punto, supongo. Entonces no tendríamos densidad. ¿Es este caso directamente observable desde el punto de vista de la derivada de Radon-Nikodym?

(Teorema de Radon-Nykodim) :

Sea $(\Omega,\mathcal{F})$ ser un $\sigma$ -espacio infinito medible con dos medidas $\mu$ y $\nu$ en él, donde $\nu$ es absolutamente continua con respecto a la medida $\mu$ . Es decir, para cada conjunto $A\in\mathcal{F}$ , $\mu(A)=0\Longrightarrow \nu (A)=0$ . Entonces existe una única función positiva medible $f:\Omega\rightarrow [0,\infty)$ s.t.

$$\nu(A)=\int_A f \mathrm{d} \mu\quad\forall A\in\mathcal{F}$$

Pregunta 1: Mi primera pregunta es sobre la definición de continuidad absoluta de una medida respecto a otra. Sólo se requiere que si una de ellas da cero para algún conjunto $A$ entonces el otro también debe dar cero. Parece que basta con que exista la función de densidad. ¿Cómo se relaciona esta continuidad absoluta con la continuidad absoluta de las funciones? Sé que una función es absolutamente continua si es diferenciable y la derivada es entonces integrable. Pero no puedo relacionar esto con la definición de derivada de Radon-Nykodim. ¿Sirve la definición de medidas para llenar ese vacío?

Pregunta 2: Consideremos el conjunto de medidas de probabilidad $$\mathcal{Q}=\{Q:Q=(1-\epsilon)P+\epsilon H,\, H\in\mathcal{H}\}$$ donde $\mathcal{H}$ es el conjunto de todas las medidas de probabilidad, $P$ es una medida de probabilidad que tiene una densidad $p$ . Entonces, parece que hay algunos $Q\in\mathcal{Q}$ que no son absolutamente continuas con respecto a $P$ . Por lo que entendí, esto sólo dice que aquellos $Q$ no puede tener una densidad con respecto a $P$ pero pueden tener una función de densidad con respecto a otra medida ¿no? En cualquier caso $H$ puede ser cualquier medida creo que debe haber alguna $Q$ que no aceptan ninguna función de densidad? Especialmente, si $H$ tiene algunos cambios abrubt. ¿Me equivoco?

Pregunta 3: Consideremos ahora el siguiente conjunto $$\mathcal{G}=\{g:D(g,f)\leq \epsilon\}\quad D(g,f)=\int g\log(g/f)\mathrm{d}\mu$$ donde $f$ y $g$ son algunas funciones de densidad. En este conjunto se sabe ahora que cada densidad existe y por lo tanto sus medidas de probabilidad correspondientes eran Radon-Nikodym differrentiable. Aquí se puede decir que toda medida $G_1$ correspondiente a $g_1\in \mathcal{G}$ es absolutamente continua con respecto a otra medida $G_2$ correspondiente a $g_2\in \mathcal{G}$ ?, por lo tanto cualquier $G$ correspondiente a $g\in \mathcal{G}$ también es absolutamente continua en relación con $F$ correspondiente a la densidad $f$ ? ¿Cómo comparar el conjunto dado en Pregunta 3 al conjunto dado en Pregunta 2 en cuanto a la existencia de las densidades y las cuestiones de continuidad absoluta?

Mi última pregunta es una cuestión de notación. En los artículos que he leído asumen que $F$ y $G$ son absolutamente continuas respecto a alguna medida dominante, por ejemplo $\mu=F+G$ . Entonces sé que $f$ y $g$ sino utilizar el mismo $\mu$ para cada $G$ ? para ver ejemplos cuando definan $D(g,f)=\int g\log(g/f)\mathrm{d}\mu$ sólo hay uno $\mu$ pero incontable número de $G$ y aparentemente todos ellos tienen una densidad con respecto a alguna medida, digamos $\phi_G$ pero entonces, ¿quién lo garantiza? $\mu=\phi_G$ para todos $G$ .

Parece que tengo muchas confusiones. Espero que puedan ayudarme a aclarar estas cuestiones. Muchas gracias por leer este post. Cualquier comentario o respuesta será muy apreciada.

4voto

Grant Puntos 116

Aprendí sobre la derivada RN en "Real Analysis" de Folland, y te aconsejaría que lo consultaras allí (Capítulo 3), ya que puede responder a tus próximas preguntas. En particular, el teorema 3.5 responde a tu P1. Establece que

Si $\nu$ es una medida con signo finito y $\mu$ es una medida positiva, entonces $\nu\ll \mu$ si para cualquier $\varepsilon >0 $ existe $\delta > 0$ tal que $\mu(E)<\delta$ implica $|\nu(E)|<\varepsilon $ para cualquier mesaurable $E$ .

Ahora bien, si $\mu$ es nuestra medida de probabilidad y $F$ es la FCD correspondiente, entonces eligiendo lo siguiente $E = \bigcup_{k=1}^n(t_k,t_{k+1}]$ nos da que $\nu\ll \lambda$ implica que $F$ es continua absoluta (como función). Aquí $\lambda$ denotan la medida de Lebesgue.

Respecto a Q2: la densidad se define relativamente a otra medida . Cualquiera que sea la medida $Q$ siempre tiene densidad con respecto a sí misma; por favor, dígame si este hecho no le ha quedado claro. Además, si $P = \lambda$ y $H = \delta_0$ entonces $Q$ no admite densidad respecto a $P$ sin embargo, admite claramente la densidad con respecto a $Q$ sí mismo.

En teoría de la probabilidad puede resultar confuso que la mayor parte del tiempo hablemos de densidades en relación con el tiempo. $\lambda$ para que ni siquiera mencionemos $\lambda$ y decir simplemente "densidad". Por eso puede olvidarse que hablamos de densidad relativa, ya que no hay densidad "absoluta", al menos en la teoría de la medida. Allí la densidad es exactamente la derivada de RN, de ahí que requiera especificar la medida "denominador".

P3: No sé a qué se refiere exactamente. Si $\nu\ll\mu$ podemos definir la divergencia KL mediante $$ D(\nu,\mu) := \int \log\left(\frac{\mathrm d\nu}{\mathrm d\mu}\right)\mathrm d\nu = \int \frac{\mathrm d\nu}{\mathrm d\mu}\log\left(\frac{\mathrm d\nu}{\mathrm d\mu}\right)\mathrm d\mu \tag{1} $$ y ésta se define puramente en términos de medidas, por lo que no depende de su representación a través de densidades.

En cuanto a su pregunta sobre el título, consulte este y que . Espero que reconsidere y (o) reformule su pregunta después de leer esta respuesta, a menos que todo le haya quedado claro. Vuelva y podremos continuar. Y te animo a que consultes el libro de Folland en general.

Añadido: Pongámonos de acuerdo en lo siguiente: dado que existe cierta confusión con respecto a la noción de densidad, sólo utilizaremos los términos "función" y "derivada RN". Podemos definir la divergencia KL $D(\nu,\mu)$ para las medidas $\nu\ll\mu$ como en $(1)$ . También podemos fijar alguna medida de referencia $\psi$ y definir un mapa similar para los argumentos funcionales, es decir, dejar que $$ \bar D_\psi(g,f):= \int g \log\left(\frac gf\right)\mathrm d\psi \tag{1'} $$ para que esté bien definido, suponemos que $$ \{f = 0\} \subseteq \{g = 0\} \tag{2}. $$ Ahora bien, estas dos nociones se relacionan del siguiente modo: $\bar D_\psi(g,f) = D(\bar\nu,\bar\mu)$ donde $$ \bar\nu(\cdot) := \int_{(\cdot)}g\,\mathrm d\psi\qquad \bar\mu(\cdot) := \int_{(\cdot)}f \,\mathrm d\psi $$ y por supuesto $(2)$ implica que $\nu\ll\mu$ . Así que, efectivamente, para hablar del conjunto $\mathcal G$ de todos funciones $g$ hay que suponer que cada función de este conjunto satisface $(2)$ : pero si no se supone que la divergencia KL sería infinita para esos $g$ (se toma integral de $\log$ del infinito) por lo que seguro que es mayor que $\epsilon$ .


Permítanme también resumir algunas relaciones en el caso unidimensional. El objeto básico es la medida de probabilidad $\mu:\mathscr B(\Bbb R) \to [0,1]$ . Su FCD es una función sobre números reales $F_\mu:\Bbb R\to [0,1]$ que viene dada por $F_\mu(x):=\mu((-\infty,x])$ por lo que a cada medida de probabilidad le corresponde su FCD única. Viceversa, a partir de cualquier función que satisfaga un par de propiedades podemos construir una medida de probabilidad cuya FCD venga dada por esta última función, véase por ejemplo aquí . Por lo tanto, las medidas de probabilidad en la recta real y las FCD están en correspondencia uno a uno, sólo que la primera es una función de conjuntos, mientras que la segunda es una función de números reales. Si $\mu \ll \lambda$ entonces su derivada RN $f_\mu := \frac{\mathrm d\mu}{\mathrm d\lambda}:\Bbb R \to \Bbb R_+$ se denomina comúnmente función de densidad de $\mu$ Sin embargo, sería más formal decir que $f_\mu$ es la densidad de $\mu$ por ejemplo $\lambda$ . Observe que $$ F_\mu(x) = \int_{-\infty}^x\mathrm \mu(\mathrm dt) = \int_{-\infty}^xf_\mu(t)\, \lambda(\mathrm dt), $$ por lo tanto, si $\mu\ll\lambda$ entonces por LDT tenemos que $F'_\mu(x)$ existe $\lambda$ -a.e. y $F'_\mu(x) = f_\mu(x)$ ( $\lambda$ -a.e.) Por ejemplo, si $F_\mu\in C^1(\Bbb R)$ entonces $F'_\mu$ es un versión de la derivada RN $\frac{\mathrm d\mu}{\mathrm d\lambda}$ y cambiando $F'_\mu$ en $\lambda$ -conjuntos nulos de cualquier manera podemos obtener otras versiones de esa derivada RN (ya que la derivada RN sólo se define unívocamente $\lambda$ -a.e.). De hecho, en la mayoría de los casos prácticos calculamos las derivadas RN utilizando las derivadas habituales; no existen muchos otros métodos para calcular las derivadas RN.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X