9 votos

Si mi objetivo es poner a prueba el cambio absoluto de las relaciones, puedo comparar las proporciones directamente sin transformación logarítmica?

Ratios (por ejemplo,$Z$=$Y$/$X$) se utilizan con frecuencia (por ejemplo, cambios de plegado en el arnm o proteína de expresión, el índice de masa corporal [IMC], etc.). Muchas personas recomiendan que las variables codificadas como proporciones (por ejemplo, cambio de tapa) debe ser el registro transformado porque están fuertemente sesgada a la derecha. Sin embargo, las relaciones ($Y$/$X$) son los cambios relativos y la relación de las distribuciones no son normales (en.wikipedia.org/wiki/Ratio_distribution). Si tanto $X$ $Y$ son lognormal, a continuación, inicie sesión($Y$/$X$) es normal (es $Y$/$X$ lognormal después de tomar la retransformación sesgo en cuenta?)

Las comparaciones entre el registro transformado los coeficientes de los cambios relativos de los cambios relativos (es decir, las proporciones). Por otra parte, la necesidad de la transformación de registro para el derecho sesgada de las variables ($Y$) ha sido cuestionada. Por ejemplo, un informe reciente (http://www.ncbi.nlm.nih.gov/pubmed/22806695) advierte sobre el mal uso de la transformación de registro para una variable. Algunos de los consejos que fueron de registro($Y$) garantiza una distribución normal sólo si $Y$ es lognormal. Es decir, no garantiza la normalidad, incluso para el derecho sesgada de las variables. Por otra parte, el anti-registro de E(log($Y$)) es la media geométrica (MG) de $Y$, que es siempre menor que E($Y$) y las pruebas de las diferencias de E($Y$) y el GM son diferentes. Finalmente, el GM no es ni más sólido ni menos probabilidades de ser afectado por los valores extremos.

Otro papel (http://econtent.hogrefe.com/doi/10.1027/1614-2241/a000110) mostró que las pruebas t de las primas variables funciona bien incluso para lognormally variables de distribución. Un 3 de papel (http://link.springer.com/article/10.1023%2FB%3AEEST.0000011364.71236.f8) mostró que el rendimiento de la prueba t en las proporciones y la prueba t en el registro de transformadas proporciones son similares.

Por lo tanto, la pregunta es cual es el resultado de interés. Porque de registro($Z$) ha de estar de vuelta-transformado a las unidades originales para ser significativo y debido a la retransformación sesgo, creo que las pruebas de la E($Z$) son más significativas.

Afortunadamente, pruebas paramétricas (por ejemplo, t-tests) son robustos a la violación del supuesto de normalidad una vez que la heterocedasticidad es explicada (por ejemplo, Welch t-test). Por ejemplo, este papel (http://www.ncbi.nlm.nih.gov/pubmed/24738055) aconseja el uso de ANOVA para probar las diferencias entre raw veces-cambios en la inmunotransferencia.

Así que mi pregunta es: Si mi objetivo es poner a prueba el cambio absoluto de los coeficientes, puedo comparar las proporciones directamente sin transformación logarítmica?

Referencia: En la regresión lineal, cuando es apropiado utilizar el registro de una variable independiente, en lugar de los valores reales?

10voto

dan90266 Puntos 609

No sólo las distribuciones de no transformadas ratios tienen formas extrañas que no coincidan con los supuestos tradicionales de análisis estadístico, pero no hay una buena interpretación de una diferencia de dos proporciones. Por otro lado, si usted puede encontrar un ejemplo donde la diferencia de dos proporciones es significativo, cuando las proporciones no representan las proporciones de un todo, por favor describa una situación semejante.

Como una variable utilizada en el análisis estadístico, las relaciones tienen un problema significativo de ser asimétrica medidas, es decir, importa mucho que el valor está en el denominador. Esta asimetría hace que sea casi sin sentido para sumar o restar los coeficientes. Ratios de registro son simétricas, y puede ser suman y se restan.

Uno puede gastar una buena cantidad de tiempo preocupándose acerca de lo que la distribución de un estadístico de prueba tiene o corregir la distribución de la "extrañeza" pero primero es importante elegir un efecto de medir que tiene el derecho de matemática y práctico de las propiedades. Las proporciones son casi siempre destinado a ser comparado por tomar la relación de proporciones, o su registro (es decir, el doble de la diferencia en los registros de la original de las mediciones).

7voto

EdM Puntos 5716

La respuesta de @FrankHarrell, y los comentarios asociados a él y a @NickCox, responder a la pregunta de forma admirable. Me gustaría agregar que el enfoque implícito en la forma de materias primas de las distribuciones de los indicadores y variables de resultado está fuera de lugar; en modelos lineales, lo importante es la linealidad de las relaciones de los predictores de los resultados y la distribución de los residuos.

También me gustaría añadir información sobre los dos artículos citados en la pregunta original que podría explicar algunas de las fuentes de la dificultad detectada por el OP. Es importante evaluar críticamente los artículos, no sólo aceptamos porque ellos han sido publicados.

El citado documento sobre la utilización indebida de registro de transformaciones por el Feng et al acertadamente señala algunos abusos de los que son posibles con registro de transformaciones, pero tiende a dejar la impresión de que el registro de las transformaciones deben ser evitados en lugar de utilizar de forma inteligente. Por ejemplo, el documento dice:

con las transformaciones que, en general, y la transformación de registro, en particular, puede ser bastante problemático en la práctica para lograr los objetivos deseados

con supuestas dificultades observadas, tales como:

no hay una relación entre el original y la media de la de registro-datos transformados...no es conceptualmente conveniente comparar la variabilidad de los datos con su equivalente transformado ... la comparación de medias de dos muestras no es la misma como la comparación de los medios de su transformada versiones

y concluye:

en lugar de intentar encontrar una adecuada distribución y/o transformación para adaptarse a los datos, uno puede considerar la posibilidad de abandonar este paradigma clásico del todo...

Yo no veo que las supuestas dificultades observadas en la que el papel de proporcionar razones para evitar el uso informado de logarítmicas o de otras transformaciones. Otros han señalado deficiencias importantes en ese papel. Soso, Altman y Rohlf escribió una respuesta directa, En defensa de transformaciones logarítmicas. La respuesta completa es aparentemente detrás de un paywall, pero yo creo que el siguiente cita constituiría el uso justo:

No ilustrar su artículo con datos reales, sin embargo, y aparecen en gran parte a ignorar el contexto en que registro se aplican las transformaciones...Que también cita fuera de contexto las personas que critican...Feng et al. también dicen que 'a Pesar de ser bien definidas estadísticamente, la cantidad de Exp(E(log X)) no tiene ninguna intuitiva y de interpretación biológica.' Nos encontramos con ningún problema en la intuición acerca de ello. Aunque la expresión se ve muy complicado, es simplemente la media geométrica.

Soso, Altman y Rohlf a la conclusión de:

La transformación de registro es una herramienta valiosa en el análisis de los biológicos y los datos clínicos. No creemos que nadie debe ser desalentado el uso de ella por este mal argumentado y engañosa de papel.

El papel que "aconseja el uso de ANOVA para probar las diferencias entre raw veces las diferencias (FD) en immunoblotting" trata muy bien con algunas de las dificultades técnicas en la realización de la densitometría de lo que se llama "western blot" (dificultades de las que estoy dolorosamente consciente), sin embargo, el casi de mano sugerencia al final del papel de "Determinar el promedio de FD y asociada a los valores de P para las repeticiones biológicas por la importación de la FD del paso (2) arriba, en un análisis estadístico con el paquete de software de un PRISMA o Analizar" no parece haber recibido un examen crítico. (También no se descarta la posibilidad de registro-la transformación de los valores de FD en el análisis estadístico.)

Una sugerencia para su uso en crudo, FD realidad contradice la idea presentada anteriormente en que el papel que este análisis es "una metodología similar a la qPCR," o cuantitativa de la reacción en cadena de polimerasa. Análisis estadístico de la qPCR es mejor hacerlo en los valores de "ciclos " umbral" o $C_t$ valores. Estos $C_t$ valores directos de los $\log_2$ de las relaciones de las cantidades originales del ácido nucleico de la secuencia analizada. De más nota en el ácido nucleico de la cuantificación, la MA parcela ampliamente utilizado en el análisis de microarrays es un gráfico de Bland-Altman en transformaciones logarítmicas de los datos de expresión. Cuando los errores son proporcionales a los valores de interés, la transformación logarítmica puede hacer un montón de sentido.

1voto

horaceT Puntos 170

Si ambas$X$ y$Y$ son normales con media cero, entonces la relación$X/Y$ sigue una distribución de Cauchy con la densidad

$p(x) = \frac{1}{\pi \gamma} \frac{\gamma^2}{(x-x_0)^2 + \gamma^2}$

donde$x_0$ es el parámetro de localización, que es una especie de medida de la centralidad de la masa, y el$\gamma$ la mitad de ancho, que es una especie de la desviación estándar de Cauchy. No tiene ningún medio, sin la varianza y no hay momentos de orden superior.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X