Este no es probablemente una buena cosa que hacer. Buscando en cada una de las covariables en primer lugar, y luego la construcción de un modelo con aquellos que son significativos es lógicamente equivalente a una búsqueda automática de procedimiento. Si bien este enfoque es intuitivo, las inferencias hechas a partir de este procedimiento no son válidos (p. ej., los verdaderos valores de p son diferentes de los reportados por software). El problema se magnifica el más grande es el tamaño del conjunto inicial de variables de control. Si usted hace esto de todos modos (y, por desgracia, muchas personas lo hacen), no puede tomar el modelo resultante en serio. En su lugar, usted debe ejecutarse en un completamente nuevo estudio, la recopilación de una muestra independiente y ajuste que el modelo anterior, para probarlo. Sin embargo, esto requiere una gran cantidad de recursos, y por otra parte, dado que el proceso está viciado y el modelo anterior es probable que un pobre, hay una fuerte posibilidad de que no se puede sostener, es decir, que es probable que los residuos de una gran cantidad de recursos.
Una mejor manera es evaluar los modelos de sustantivos de interés para usted. A continuación, utilice un criterio de información que penaliza el modelo de flexibilidad (como el AIC) para adjudicar entre los modelos. Para la regresión logística, la AIC es:
$$
AIC = -2\times\ln(\text{probabilidad}) + 2k
$$
donde $k$ es el número de covariables incluidas en el modelo. Usted desea que el modelo con el menor valor de AIC, todas las cosas en igualdad de condiciones. Sin embargo, no es siempre tan simple, que ser precavidos a la hora de varios modelos tienen valores similares para la AIC, a pesar de que puede ser más bajo.
Me incluir la fórmula completa de la AIC aquí, ya que las diferentes salidas de software diferentes tipos de información. Puede que tenga que calcular sólo la probabilidad, o usted puede conseguir el final de la AIC, o cualquier otra cosa.