6 votos

Conjugado antes de un binomio-como la distribución de

Cada semana, mi $m-1$ amigos y yo entramos a un pub quiz el cual ha $n$ de los puntos disponibles. En cualquier semana dada sólo a algunos de nosotros están allí. Registro de la presencia/ausencia de miembro de la $i$ en la semana $t$ en la matriz $x_{ti}$.

Me gustaría construir un modelo predictivo para el número de puntos que la puntuación en cualquiera de las semanas, dependiendo de quién los haya. Un modelo simple es asumir que cada pregunta es igual de duro, y que el jugador $i$ probabilidad de $p_i$ de saber cualquier pregunta. Entonces la probabilidad de que se obtenga un determinado pregunta correcta es

$$q({\bf x},{\bf p}) = 1 - \prod_{i=1}^m(1-p_i)^{x_i}$$

Por lo tanto, la probabilidad de que la puntuación $k$ puntos es

$$P({\rm Score} = k|{\bf x},{\bf p}) = {n\choose k}q^k(1-q)^{n-k}$$

y la log-verosimilitud para un determinado ${\bf p}$ ${\bf x}$ es

$$L = \log {n\choose k} + k\log q + (n-k)\log(1-q)$$

Puedo escribir un numérica de la rutina que maximiza el este, para encontrar la máxima probabilidad estimador $\bf p$. Sin embargo, la estimación resultante mal overfits los datos (como puede ser detectado por validación cruzada).

Una buena solución parece ser la introducción de una pena (regularización) plazo en $L$, lo que penaliza a los pequeños o grandes probabilidades. Como yo lo entiendo, esto es equivalente a tener un previo en $\bf p$. Sin embargo, no sé cuál es la forma de este estado debe ser. Dos opciones sencillas para el término de penalización son:

$$\| {\bf p} - 1/2\|^2$$

y

$$-\sum_i\log \left( \frac{p_i}{1-p_i}\right)$$

pero estos son muy ad-hoc. Yo estaría interesado en saber lo que un adecuado conjugado antes de es (si existe). Cualquier sugerencias?

4voto

Cyan Puntos 1965

No hay conjugado antes de esta probabilidad. Las probabilidades de que admitir conjugado distribuciones corresponden a los datos de las distribuciones que son miembros de algunas exponencial de la familia. Tener una función no lineal de los parámetros de la log-verosimilitud hace que sea imposible para la distribución de datos a pertenecer a una exponencial de la familia.

Aunque no hay conjugado antes, una posibilidad razonable de un registro previo es

$L_0({\bf p} ; {\bf j}, {\bf N} ) = \sum_i [j_i \log(p_i) + (N_i - j_i) \log (1 - p_i)]$

Usted puede pensar en este registro previo como equivalente a una log-verosimilitud para un conjunto de datos en que cada persona hizo una serie de preguntas solo y respondió correctamente a$j_i$$N_i$. Esta interpretación permite establecer la previa de los parámetros de ${\bf j}$ ${\bf N}$ en un razonablemente de manera intuitiva. Me gustaría ser un poco sorprendido si incluso los pequeños valores de $N_i$ (por ejemplo, de 2 a 4) no proporcionar una buena regularización. Tenga en cuenta que $j_i$ $N_i$ no necesita ser enteros.

A mí me parece que usted está pensando en usar el plug-in de la distribución predictiva. Puedo sugerir un total de Bayes y el uso de la posterior distribución predictiva en su lugar? Se requeriría de MCMC, que pueden ser más problemas de lo que usted está dispuesto a ir. (Si estás usando Matlab me puede recomendar un MCMC rutina que puedan acortar su tiempo de codificación considerablemente.)

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X