3 votos

¿Qué tan bien se ajusta un solo punto de datos a una distribución?

Tengo que encontrar una manera de medir la 'calidad' de una distribución para un proyecto de investigación.

Recopilamos datos durante un período de tiempo $t_0$ a través de $t_1$ y luego estimamos la distribución que se ajusta a estos datos. En un momento posterior, $t_2$, recopilamos un solo dato. ¿Hay alguna manera de medir la probabilidad de que la distribución estimada inicialmente sea 'correcta', dado este nuevo punto de datos?

Suponemos que los puntos de datos son variables aleatorias independientes.

¡Gracias!

0 votos

Supongo que te refieres a los puntos de datos independientes condicionados al proceso generador. ¡Si son totalmente independientes, entonces recolectar datos por un período $(t_0, t_1)$ no te dice nada acerca de otro período!

3voto

Factor Mystic Puntos 12465

Llama a tu muestra original $X = \{x_1, \ldots, x_n \}$. Si tienes una estimación de densidad $\hat{f}(x|X)$ computada a partir de tus datos, entonces la verosimilitud de tu nuevo punto de datos $u$ es simplemente $\mathcal{L}(u)=\hat{f}(u)$. Valores más altos de $\mathcal{L}$ implican que es más plausible que el nuevo punto de datos se haya obtenido de la misma distribución subyacente de la muestra original.

1voto

AdamSane Puntos 1825

No sin algunas suposiciones adicionales.

Imagina que la distribución de la que se extraen los datos consiste en $n+1$ valores posibles igualmente probables, y que en $(t_0,t_1)$ observas $n$ de esos valores. En el tiempo $t_2$ observas el $(n+1)$-ésimo valor posible para esa distribución.

No importa qué tan lejos esté ese último punto del resto de los datos, la muestra observada no es más "extraña" que tomar cualquiera de los otros valores para el último punto; de hecho, la MLE de la distribución (la función de distribución empírica) es la más cercana posible a la verdadera distribución.

0 votos

¡Gracias por la respuesta! Entiendo tu punto allí... ¿Puedes dar un ejemplo de qué suposiciones adicionales podrían ayudar? Por ejemplo, ¿Si asumimos que es una distribución normal? Estaba intentando utilizar el Teorema de Bayes para encontrar la probabilidad de que sea la distribución dada el punto de datos, pero me encontré atascado en el punto donde necesito la probabilidad de esa distribución...

0 votos

¿Qué significa "más extraño"? Seguramente algunos valores para el punto en $t_2$ tienen mayor sorpresa que otros dados la distribución predictiva. De manera similar, algunas distribuciones son más probables que otras dada la valor para el punto en $t_2$.

1voto

andynormancx Puntos 234

Permita que su distribución inferida a partir de los datos recopilados en $(t_0, t_1)$ tenga parámetros $\theta$. La probabilidad sobre $\theta$ es proporcional a la densidad del punto observado en $t_2$ dado $\theta$:

$$L(\theta \mid x_{t_2}) = f(x_{t_2} \mid \theta).$$

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X