6 votos

¿"Bayesglm", valores p y grados de libertad?

Estoy intentando realizar unas regresiones logísticas (y soy un usuario neófito de R). Inicialmente utilicé "glm" para calcular los coeficientes, el AIC y los valores p; esto funcionó muy bien hasta que me encontré con un conjunto de datos que sufría de separación completa . En [1], Gelman et alia sugieren el uso de un previo (informativo) para abordar este problema; el algoritmo correspondiente se implementa en R como "bayesglm" (en el paquete ARM).

Este es mi problema. Antes, con "glm", calculaba los valores p de la siguiente manera:

mylogit <- bayesglm(a ~ b+c+d+e+f+g+h, data = mydata, family="binomial")
with(mylogit, pchisq(null.deviance - deviance, df.null - df.residual, lower.tail = FALSE))

Hay 53-48=5 grados de libertad:

Null deviance: 71.188  on 53  degrees of freedom
Residual deviance: 37.862  on 48  degrees of freedom

Sin embargo, si utilizo "bayesglm" en lugar de "glm", los grados de libertad resultantes me resultan un poco sorprendentes:

Null deviance: 22.279  on 53  degrees of freedom
Residual deviance: 39.030  on 54  degrees of freedom

Si introduzco la fórmula anterior para obtener un valor p, ¡tengo -1 grados de libertad! ¿Puede alguien ayudarme a obtener una respuesta más sensata (o ayudarme a interpretar esto)?

Por cierto, la documentación sobre el comando "bayesglm" incluye el siguiente comentario ominoso:

Incluimos todos los argumentos de glm() pero no hemos comprobado que todas las opciones (por ejemplo, los offests, los contrastes, la desviación para el modelo nulo) funcionen.

1] Gelman, Andrew, et al. "A weakly informative default prior distribution for logistic and other regression models". The Annals of Applied Statistics (2008): 1360-1383.

6voto

Bou Puntos 1859

SMARTS está diseñado deliberadamente para ser un superconjunto de SMILES. Es decir, cualquier representación válida de SMILES debería ser también una consulta válida de SMARTS, que recuperará la misma estructura que representa la cadena SMILES.

Sin embargo, como lenguaje de consulta, SMARTS puede ser más general que SMILES. Por ejemplo, CC como cadena SMILES representa un único compuesto: el etano. Sin embargo, como consulta SMARTS CC coincidirá con el etano, pero también con el propano, el ácido acético, el ciclohexano, la vancomicina, etc.

También hay cadenas SMARTS que no son cadenas SMILES válidas. Usted enumera varias en su pregunta: [#6]-1=[#6]-[#6](-[#6]-[#6](-[#6]-1)-[#6])=[#8] no es una representación SMILES válida, a menos que su analizador SMILES sea especialmente generoso. Incluso si lo es, [#6]-1=[#6]-[#6](-[#6]-[#6](-[#6]-1)-[#6])=[#8,#7] también es una consulta SMARTS válida que debería coincidir con su molécula, pero ni siquiera un analizador SMILES generoso es probable que la acepte.

A pesar de ser similares, SMARTS y SMILES están pensados para cosas fundamentalmente diferentes: el propósito de SMILES es representar compuestos particulares, mientras que SMARTS representa una consulta contra un rango de posibles moléculas, o una descripción abstracta de un conjunto de posibles moléculas. Por ello, no son interconvertibles, aunque las cadenas sean literalmente idénticas.

Para su particular caso, sí, CC1CC=CC(=O)C1 es tanto un SMILES como un SMARTS válido, pero como consulta SMARTS, representa no sólo la 5-metil-2-ciclohexen-1-ona, sino también la 5-propil-2-ciclohexen-1-ona y la 3-hidroxi-5-butil-6-amino-2-ciclohexen-1-ona, así como muchas otras, todas las cuales contienen esa subestructura. El visor de SMARTS que enlazas no representa esto explícitamente, porque está implícito en el uso de SMARTS que es un patrón de subestructura para una clase más amplia de compuestos.

1 votos

Gracias por los consejos, son muy útiles. Y agradezco tu sugerencia de volver a comprobar las estimaciones de desviación nula. En cuanto a los grados de libertad, no es una errata: aunque hay 7 variables independientes (probabilísticamente), el rango de la matriz de observaciones es sólo 5 (es decir, las observaciones son linealmente dependientes). Gracias.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X