La prueba de hipótesis es similar a la de un problema de Clasificación. Por lo que dicen, tenemos 2 posibles etiquetas para una observación (sujeto) -- Culpable o No Culpable. Vamos a No ser Culpable de la Hipótesis nula. Si vemos el problema desde el punto de vista de la Clasificación nos gustaría entrenar un Clasificador que predicen la probabilidad de que los sujetos pertenecientes a cada una de las 2 Clases, a la vista de los Datos. Nos gustaría, a continuación, elegir la Clase con mayor probabilidad. En ese caso 0.5 probabilidad sería el umbral natural. Podemos variar el umbral en el caso de que se le asignaron diferentes costos de Falsos Positivos vs Negativos Falsos errores. Pero rara vez nos iría tan extrema como establecer el umbral de 0,05, es decir, asignar el tema a la Clase "Culpable" sólo si la probabilidad es de 0,95 o superior. Pero si entiendo bien, esto es lo que estamos haciendo como una práctica estándar cuando vemos el mismo problema como un problema de prueba de Hipótesis. En este último caso, no vamos a asignar la etiqueta de "No Culpable" --equivalente a la asignación de la etiqueta de "Culpable" - sólo si la probabilidad de ser "No Culpable" es menor que 5%. Y tal vez esto podría tener sentido si de verdad queremos evitar para condenar a personas inocentes. Pero, ¿por qué esta regla debe prevalecer en todos los Dominios y en todos los casos?
Decidir qué Hipótesis para adoptar es equivalente a definir un Estimador de la Verdad la vista de los Datos. En la Estimación de Máxima Verosimilitud, aceptamos la Hipótesis de que es más probable, dada la Información, aunque no necesariamente de manera abrumadora más probable. Ver el siguiente gráfico:
El uso de un enfoque de Máxima Verosimilitud nos estaría a favor de la Hipótesis Alternativa en este ejemplo, si el valor de la Predictor fue de 3, por ejemplo, 4, aunque la probabilidad de que este valor se han derivado de la Hipótesis Nula hubiera sido mayor que 0.05.
Y aunque el ejemplo con el que he empezado el post es quizás emocionalmente cargada, se podría pensar en otros casos, por ejemplo, una mejora técnica. Por qué debemos dar una ventaja para el Status Quo cuando los Datos nos dicen que la probabilidad de que la nueva solución es una mejora, es mayor que la probabilidad de que no es?