6 votos

Debe de falso descubrimiento de ser controlado en la adquisición de datos de nivel, o debería, en la interpretación de los datos de nivel?

Debe de falso descubrimiento de ser controlado en la adquisición de datos de nivel, o debería, en la interpretación de los datos de nivel?

Tengo un experimento en el que microarrays se utiliza para cuantificar la expresión de unos 30.000 genes (variables) en dos grupos de tejidos biológicos (grupo-tamaños de 75 y 76). Raw de la matriz de datos fue pre-procesado para remover las señales de fondo y los genes cuyos niveles de expresión son indetectables, y para normalizar los valores a través de matrices. El final de los datos fue analizada mediante el test de Mann-Whitney, para comparar la expresión génica entre los dos grupos para identificar genes expresados diferencialmente, con tasa de falso descubrimiento (FDR) controlado con el Benjamini-Hochberg procedimiento. En FDR <5%, no se gen es identificado como diferencialmente expresados, y me formalmente a la conclusión de que " no hay una expresión diferencial de genes entre los dos tejidos."

Ahora, supongamos que alguien está interesado en la expresión de sólo un gen específico. El uso de mi pre-procesado de datos de expresión génica y la U de prueba, se comparan los dos grupos para la expresión de sólo este gen y el aviso de un valor de P <0.05, el comúnmente utilizado umbral de significancia en mi campo de estudio. Como esto no implica múltiples pruebas, no hay de falso descubrimiento de control. Puede este observador formalmente a la conclusión de que " los genes diferencialmente expresados entre los dos tejidos,' contradiciendo mi conclusión?'

O si el observador se han aplicado de falso descubrimiento de control debido a que tal control tiene que ser aplicado en la adquisición de datos de nivel (según el cual, los datos sobre múltiples variables fueron recogidos) y no en la interpretación de los datos de nivel (según el cual, solamente los datos de una variable se analiza)?

5voto

phaneron Puntos 1017

Sostengo firmemente que se debe aplicar sólo en la interpretación de nivel. La multiplicidad implica implícitamente la definición de una investigación realizada por un investigador(s) (es decir, el estudio de sabios de la tasa de error para ser controlado) y las necesidades para reflejar con precisión las intenciones que condujo el proceso de generación de insumos para la conclusión/decisión. (Este es un poco resbaladiza y, por ejemplo, Wittgenstein admitió más tarde en su carrera en la que lamenta no darse cuenta de la intencionalidad principios de la lógica.)

Por ejemplo, si alguien pretende hacer todas las comparaciones, pero se detuvo con el primero porque era tan buena – esta es una multiplicidad que ser tratado. Por otro lado, si esa comparación era creíble documentado como el único ser de hecho no la hay. No debería importar si el vendedor de entrada de datos que estaba tomando un curso de estadísticas sin permiso corrió todas las comparaciones posibles, como un ejercicio. Que suena como su situación para mí. ( Esta sentencia puede muy resbaladizo y gracias a user603, puedo señalar a Jake el cumpleaños de un buen ejemplo http://www.johndcook.com/blog/2012/09/07/limits-of-statistics/ )

Algo de esto sucedió a una colega. Quieren probar Un versus placebo pero alguien quería que ellos includ B así. Ellos pensaban que B era tonto, pero de ser un buen tipo incluido en el grupo B. El resultado fue Un versus placebo fue claramente significativo, pero no después de ajustar por B. Que no podría obtener el estudio publicado por culpa de eso.

También, Ed George tuvimos una agradable conversación en la reunión conjunta de este verano, donde él era, en efecto, argumentando a favor de una analistas posterior para aquellos que tienen acceso a los datos en comparación con un reporte posterior para aquellos que sólo averiguar acerca de los estudios si no es de forma selectiva informó a ellos.

Pensando en su charla y después de que resbaladizas la intencionalidad de las cosas, posiblemente, también aplica para los analistas, los "Hombres de Negro" película me pareció relevante, o al menos su uso de la Neuralizer - http://en.wikipedia.org/wiki/Neuralizer

Es como si el Bayesiano analista sabe que habría sido neuralized tan pronto como se dieron cuenta de un conjunto de datos dado no lograr algún tipo de pre-meta establecida. Así que cuando se obtiene un conjunto de datos que no cumple es que se dan cuenta que no saben cuántas veces han sido neuralized pero saben que la regla de selección para evitar ser neuralized este tiempo.

2voto

JohnRos Puntos 3211

Como @phaneron ha dicho, no hay necesidad de que la multiplicidad de control si sólo considerar la posibilidad de un gen. Quiero añadir para que la prueba de hipótesis sirve para dos propósitos: (a) convencer a ti mismo y (b) convencer a "el mundo". Para el propósito de (a), recordemos que el BH procedimiento de controles de la "espera que la proporción de falsos descubrimientos sobre la repetición de las pruebas de la misma hipótesis". Si usted (honestamente) consideran que la prueba de una hipótesis (snp), no hay multiplicidad en la mano y la única pregunta que queda es ¿"usted encontrar frecuentista de pruebas de hipótesis convincente?".

Para el propósito de (b) la dificultad podría ser la de convencer de que la elección de la snp fue "honesto". Que técnicamente significa que el enfoque en el que un solo snp se ha realizado utilizando diferentes (por lo tanto estadísticamente independientes) datos de los datos que sirven para la prueba de hipótesis.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X