3 votos

Procedimiento Benjamini-Hochberg con valores p de igual rango

Tengo problemas con la corrección de Benjamini-Hochberg debido a valores p de igual rango y agradecería que me ayudaran.

Mi problema es el siguiente: Tengo que hacer 11 comparaciones y el umbral está fijado en 0,05. Mis valores p clasificados son: p1=0,03125, p2=0,0312, p3=0,0312; p4=0,0312; p5=0,0312; p6=0,0312, p7=0,0312, p8=0,3984, p9=0,5182, p10=0,7912, p11=1.

Y los nuevos umbrales con corrección de Benjamini son: (1) 0,0045, (2) 0,0091; (3) 0,01364; (4) 0,01818; (5) 0,02273; (6) 0,02727; (7) 0,0318; (8) 0,03636; (9) 0,0409; (10) 0,0455; (11) 0,05.

Ahora bien, si comparo el valor p con el umbral, los 6 primeros valores p son mayores que el valor p, por lo que no se puede rechazar la hipótesis nula. Sin embargo, el séptimo valor p es menor que el umbral correspondiente (p7=0,0312<0,0318) En este caso, ¿se debe rechazar o no la hipótesis nula correspondiente a los siete primeros valores p?

1voto

blembo Puntos 3

En su ejemplo, rechazaría los siete primeros. El procedimiento BH es un procedimiento escalonado: después de ordenar sus pvalores como $p_1,\dots,p_m$ , usted debe tomar la última $k$ tal que $p_k \leq \frac{k}{m}\alpha$ independientemente de si tiene $p_{k'}$ con $k'<k$ que no cumplan esto.

Tal vez otra persona pueda intuirlo mejor, pero yo lo veo así. El TL;DR es que lo que usted observó en realidad sucede muy a menudo, y esto está perfectamente bien: ordenamos la $p_k$ para obtener la CDF inversa y así poder aproximar la FDR, no hay nada inherentemente importante sobre el ordenamiento, excepto que es computacionalmente fácil... realmente sólo necesitamos calcular $\hat{F}_m(u)$ que aproxima la distribución (desconocida) de los pvalores, y el método que toma por orden lo hace rápida y fácilmente. Para ampliar esto:

BH funciona de la siguiente manera: supongamos que tenemos $\pi$ pruebas que sí rechazan la nula y, por tanto $1-\pi$ pruebas que son realmente nulas. Bajo el nulo, un valor p $p$ está uniformemente distribuida, y por tanto F_{null}(u) = u. La distribución de los pvalores que están bajo el falso nulo tienen alguna distribución desconocida $F_{notnull}(u)$ . Entonces la distribución de valores p $p$ es $$F(u) = (1-\pi)F_{null}(u) + \pi F_{nonnull}(u) = (1-\pi)u + \pi F_{nonnull}(u)$$

Se puede demostrar que para cualquier nivel $u$ (Avísame si quieres una prueba de esto, pero probablemente se puede encontrar en línea),

$$FDR(u) \approx \frac{(1-\pi)u}{F(u)}$$

y todo el punto de FDR es que queremos encontrar $u$ para que $FDR(u) = \alpha$ (que es precisamente poner el FDR al nivel $\alpha$ .

No lo sabemos. $F(u)$ por lo que lo aproximamos ordenando los $p_k$ 's y tienen

$$\hat{F}_m(u) = \frac{1}{m} \sum_i 1\{P_i\leq u\}$$

y cuando ignoramos los empates (es fácil ajustarlo para que no haya diferencia, los pvalores son continuos, así que siempre habrá alguna diferencia entre ellos en la realidad, y tu ejemplo sigue siendo válido si añades alguna pequeña perturbación y reordenas), tenemos $\hat{F}_m(P_i) = \frac{i}{m}$ .

Tampoco sabemos $\pi$ por lo que, de forma conservadora, lo fijamos en $\pi = 0$ . Entonces tenemos que queremos que el $p_i$ para que \begin{align*} \alpha = FDR(p_i) & \approx \frac{p_i}{\hat{F}_m(u)} \\ & = \frac{p_im}{i} \\ \end{align*}

y por eso queremos $p_i$ para que $\alpha\frac{i}{m} = p_i$ (o, siendo realistas, queremos acercarnos lo más posible a esta cifra, así que tomamos el máximo $i$ para que $\alpha\frac{i}{m} \geq p_i$ y rechazar todos los que están por debajo de este $p_i$ por lo que no nos importa nada anterior a este valor.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X