En mi investigación me han topado con el siguiente problema general: tengo dos distribuciones $P$ $Q$ sobre el mismo dominio, y un gran (pero finito) número de muestras de esas distribuciones. Las muestras son de forma independiente e idénticamente distribuidas de una de estas dos distribuciones (a pesar de que las distribuciones pueden ser relacionados: por ejemplo, $Q$ puede ser una mezcla de $P$ y en algunos otros de la distribución.) La hipótesis nula es que las muestras provienen de $P$, la hipótesis alternativa es que las muestras provienen de $Q$.
Estoy tratando de caracterizar el Tipo I y Tipo II de errores en la prueba de la muestra, a sabiendas de las distribuciones $P$$Q$. En particular, estoy interesado en la delimitación de un error dado que el otro, además del conocimiento de $P$$Q$.
He preguntado a una pregunta acerca de las matemáticas.SE sobre la relación de la Variación Total de la distancia entre el $P$ $Q$ a prueba de las hipótesis, y recibió una respuesta que he aceptado. Que respuesta tiene sentido, pero aún no he sido capaz de envolver mi mente alrededor del significado más profundo detrás de la relación de la Variación Total de la distancia y de la prueba de hipótesis como que se refiere a mi problema. Por lo tanto, he decidido recurrir a este foro.
Mi primera pregunta es: es la variación total enlazado en la suma de las probabilidades de Tipo I y de Tipo II errores independiente de la prueba de hipótesis el método que se emplea? En esencia, siempre existe una probabilidad no nula de que la muestra podría haber sido generado por una de las distribuciones de la probabilidad de que al menos uno de los errores debe ser distinto de cero. Básicamente, usted no puede escapar la posibilidad de que su hipótesis probador de cometer un error, no importa la cantidad de procesamiento de la señal que hacer. Y el Total de la Variación de los límites que exacta posibilidad. Es mi entendimiento correcto?
También hay otra relación entre el Tipo I y II, los errores y las distribuciones de probabilidad subyacentes $P$$Q$: la divergencia KL. Por lo tanto, mi segunda pregunta es: KL-divergencia obligado sólo aplicable a la hipótesis específica el método de prueba (que parece surgir en torno a la log-likelihood ratio método mucho) o se puede aplicar en general a través de todas las pruebas de hipótesis métodos? Si se aplica a través de todas las hipótesis de los métodos de prueba que ¿por qué parece ser muy diferente de la Variación Total bound? Se comporta de manera diferente?
Y mi pregunta es: ¿hay un conjunto prescrito de circunstancias, cuando debería utilizar cualquiera de los obligados, o es puramente una cuestión de conveniencia? Cuándo debe el resultado derivan de la utilización de uno obligado espera con el otro?
Me disculpo si estas preguntas son triviales. Yo soy un científico de la computación (por lo que esto parece como una fantasía de la coincidencia de patrones problema para mí :) .) Sé que la teoría de la información razonablemente bien, y se han graduado de fondo en la teoría de la probabilidad así. Sin embargo, estoy empezando a aprender todos de esta prueba de hipótesis cosas. Si es necesario, voy a hacer mi mejor esfuerzo para aclarar mis dudas.