Si la relación funcional entre la exposición y el promedio de respuesta no es una forma de " S "curva logística, todavía hay razones por las que podríamos considerar una forma de" S " curva logística de una significativa resumen de los datos.
Como un ejemplo, se podría haber omitido un factor pronóstico de un modelo, lo que significa que el verdadero marginal de la relación entre la exposición y el resultado es que no se logística, sino un complicado semi-función logística que los promedios de seguridad de riesgos a través de varios logística condicional curvas. Este es el principal de la no-colapso en la regresión logística.
Básicamente, podemos rara vez sea cierto que la forma de S de logística tendencia es, de hecho, el "derecho"..., pero es una de las más útiles! Todos los modelos están equivocados, algunos modelos son útiles.
Kenji es justo que cuando tratamos de aproximar una forma de S de la tendencia, y los datos muestran una fuerte distribución violaciones, puede haber algunos análisis de sensibilidad para considerar como pruebas de orden superior polinomio efectos. Otro tipo de prueba a considerar es la de los breakpoints, el ajuste de los "nudos" de manera que las tendencias pueden cambiar de dirección. Estos enfoques se hibridó en splines y aún más general mediante el uso de LOESS curvas para explorar general de relaciones no lineales entre la exposición y los resultados.
Sin embargo, puede volver a la pregunta original: ¿puede usted decir "quiero resumir estos datos mediante una sola curva logística cuyo intercepto representa log-odds de que el resultado de la exposición a=0 y cuya pendiente es la log-odds ratio como medida de la asociación entre una exposición y un resultado". El deseo es, entonces, para obtener una robusta error de estimación que es imparcial y consistente. La curva S, a continuación, se toma para resumir una tendencia en los datos, que se puede considerar como una regla de oro: se incrementa el riesgo tienden a aumentar o disminuir la exposición va para arriba, y por cuánto? Para ello, sólo es necesario aplicar sándwich basado en los errores estándar. Esto se puede hacer utilizando Ecuaciones de Estimación Generalizadas de trabajo con independencia de la estructura de covarianza, logística enlace, binomial y la varianza de la estructura.