Está bien establecido que los valores de p son distribuidos de manera uniforme cuando la hipótesis nula es verdadera. Esto se deduce de la definición de un p-valor
La probabilidad de observar un valor (o más extremo) cuando los valores son extraídos de la conocida, y se fija la distribución (es decir, nula es verdadera).
Este hecho permite una gama de seguimiento de análisis cuando se mira en la distribución de pvalues.
http://varianceexplained.org/statistics/interpreting-pvalue-histogram/ ejemplos de mirar el valor p de los histogramas.
Sin embargo, me preocupa que con una probabilidad diferente. En lugar de la proporción de observaciones que son "más extrema". Me gustaría saber la proporción de observaciones que son "más raro'.
Es cierto que más extremas' implica 'más raro', sin embargo, "más raro" no implica "más extrema", particularmente para multimodal de las distribuciones bajo el nulo como se muestra en las 2 imágenes de abajo. Una observación puede estar cerca de la media y todavía ser una rara observación de una baja densidad, por parte de la nula distribución.
Una cara valor de p $$P(X > x | H)$$
Para mi 'valores d': $$P(\theta(X) \le \theta(x) | H)$$
Para una función de densidad de theta (que en mi caso viene de una simple univarate KDE)
Preguntas:
1) ¿cuáles son estos "valores d" se llama? No puedo ser la primera persona que tiene esta pregunta?
2) ¿Cómo son estos "valores d" distribuido bajo Ho?
Deje $0 \le \beta \le \max_x(\theta(x))$ (la densidad del modo más alto)
$P(\theta(x) \le 0) = 0$
$P(\theta(x) \le \max_x(\theta(x))) = 1$
$P(\theta(x) \le \beta) = {}$??
Esto es como una especie de integración vertical sobre los valores de la densidad, pero dejando fuera cualquier densidad > umbral.
3) ¿la distribución de los 2 se mantenga independientemente de la forma de la distribución de las observaciones es bajo Ho? (Para los valores de p -> uniforme).