4 votos

¿Utilizando a priores informados para tener en cuenta para la separación perfecta en regresión logística?

En la generación de regresiones logísticas para el tratamiento de datos de supervivencia, perfecta separación es un problema en algunos de mis conjuntos de datos. He decidido usar un enfoque Bayesiano para dar cuenta de la perfecta separación de Fuentes: (Gelman 2008) y esta pregunta. Este enfoque también me permite fácilmente hacer predicciones a partir de la regresión utilizando desarrollado una función en R.

Mi comprensión de este enfoque Bayesiano es limitado. Me pueden establecer la previa df para un valor arbitrario, aumentando hasta que no tengo un problema de ajuste del modelo debido a la separación perfecta, pero no entiendo lo que esta regularización es efectivamente haciendo.

Desde mi entender, el uso informativo de los priores supone que voy a saber algo acerca de los datos y la incluyo como un punto de partida para el ajuste del modelo. Una débil informativo antes de no suministrar cualquier información controversial pero pueden extraer datos de distancia de la incorrecta apreciación. Creo que la última es más alineadas con mi método propuesto (Fuente). He leído esto pero no tengo ninguna información previa sobre la cual basar las distribuciones previas o df.

Sé que esto es una simplificación de la comprensión que lleva a mi pregunta:

Lo que la información que estoy proporcionando a la modelo cuando me arbitrariamente el antes de el df a un nivel que permite el modelo de converger?

1voto

Björn Puntos 457

No sé qué quiere decir con "df" y cómo este parámetro (o lo que sea) influye en la previa se están contemplando la posibilidad de su uso.

El acercamiento común de uno, si realmente sólo han binomial/binario de datos es el uso de Firth verosimilitud penalizada en regresión, lo que corresponde a un máximo de una estimación a posteriori con un relativamente vagas antes (Jeffreys' antes). Es muy vago, a menos que usted tiene super-datos dispersos, en ese caso se debe sobre todo a no prestar demasiada atención a las estimaciones puntuales (y en lugar de observar que generalmente CIs son muy anchos). Esto se lleva a cabo en una gran cantidad de paquetes de software. Normalmente es suficiente para asegurar la convergencia de un MAPA de estimación (no muy seguro, si no hay eventos en todo). Usted puede hacer más o menos lo mismo con otros enfoques Bayesianos - esencialmente el tiempo que usted especifique una adecuada distribución como el anterior, el posterior es una distribución adecuada (pero a veces puede ser difícil de ejemplo).

Dependiendo de la configuración que se está trabajando, no puede ser anterior a los experimentos que ayude a decir lo que usted esperaría en su categoría de referencia, ver y siempre se puede hacer la previa más vaga o de cola larga, si hay dudas en cuanto a la aplicabilidad de la previa. Del mismo modo, se puede saber o creer que los efectos del tratamiento en el campo de la investigación rara vez supera un determinado odds ratio (or otro efecto de la medida, sólo usando este ejemplo, porque usted ha mencionado de regresión logística), por ejemplo, puede creer que la verdadera razón de momios fuera de [0.1, 10] (o log-odds ratios fuera de [log(0.1), log(10)]) son raros, que puede hacer que usted considere por ejemplo, una larga cola de Cauchy(0, 0.37) antes de sus coeficientes de regresión otros de la intersección. Véase también el Stan antes de la Elección de la Recomendación de la Wiki.

La otra cosa que me preguntaba es si sus datos son verdaderamente binomial y debe ser analizado mediante regresión logística, "el tratamiento de datos de supervivencia" suena como que hay un componente de tiempo y de ignorar a los que pueden causar problemas (o no dependiendo de su configuración). Incluso si usted no tiene el individuo de registros de pacientes con tiempos exactos, puede haber métodos para tomar esto en cuenta.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X