Ambas pruebas modelan implícitamente la relación entre la edad y la respuesta, pero lo hacen de forma diferente. La elección de una u otra depende de cómo se decida modelar esa relación. Su elección debería depender de una teoría subyacente, si la hay; del tipo de información que quiera extraer de los resultados; y de cómo se seleccione la muestra. En esta respuesta se analizan estos tres aspectos por orden.
Describiré la prueba t y la regresión logística utilizando un lenguaje que supone que se está estudiando una población bien definida de personas y se desea hacer inferencias de la muestra a esta población.
Para apoyar cualquier tipo de inferencia estadística debemos asumir que la muestra es aleatoria.
-
Una prueba t asume que las personas de la muestra que responden "no" son una muestra aleatoria simple de todas las personas que no responden en la población y que las personas de la muestra que responden "sí" son una muestra aleatoria simple de todas las personas que responden sí en la población.
Una prueba t hace suposiciones técnicas adicionales sobre las distribuciones de las edades dentro de cada uno de los dos grupos de la población. Existen varias versiones de la prueba t para manejar las posibilidades probables.
-
Regresión logística asume que todas las personas de una edad determinada son una simple muestra aleatoria de las personas de esa edad en la población. Los distintos grupos de edad pueden presentar diferentes tasas de respuestas afirmativas. Estas tasas, cuando se expresan como probabilidades logarítmicas (en lugar de como proporciones directas), se supone que están relacionadas linealmente con la edad (o con algunas funciones determinadas de la edad).
La regresión logística se amplía fácilmente para dar cabida a relaciones no lineales entre la edad y la respuesta. Dicha ampliación puede utilizarse para evaluar la plausibilidad de la hipótesis lineal inicial. Es factible con conjuntos de datos grandes, que ofrecen suficiente detalle para mostrar las no linealidades, pero es poco probable que sea de gran utilidad con conjuntos de datos pequeños. Una regla generalizada, según la cual los modelos de regresión deben tener diez veces más observaciones que parámetros, indica que se necesitan bastante más de 20 observaciones para detectar la no linealidad (que necesita un tercer parámetro además del intercepto y la pendiente de una función lineal).
Una prueba t detecta si las edades medias difieren entre los que no responden y los que sí lo hacen en la población. Una regresión logística estima cómo varía la tasa de respuesta en función de la edad. Como tal, es más flexible y capaz de proporcionar información más detallada que la prueba t. Por otro lado, tiende a ser menos potente que la prueba t para el propósito básico de detectar una diferencia entre las edades medias de los grupos.
Es posible que el par de pruebas presente las cuatro combinaciones de significación y no significación. Dos de ellas son problemáticas:
-
La prueba t no es significativa, pero la regresión logística sí. Cuando los supuestos de ambas pruebas son plausibles, tal resultado es prácticamente imposible, porque la prueba t no trata de detectar una relación tan específica como la que plantea la regresión logística. Sin embargo, cuando esa relación es lo suficientemente no lineal como para que los sujetos de más edad y los más jóvenes compartan una opinión y los de mediana edad otra, entonces la extensión de la regresión logística a las relaciones no lineales puede detectar y cuantificar esa situación, que ninguna prueba t podría detectar.
-
La prueba t es significativa pero la regresión logística no lo es, como en la pregunta. Esto sucede a menudo, especialmente cuando hay un grupo de encuestados más jóvenes, un grupo de encuestados de más edad y pocas personas entre ellos. Esto puede crear una gran separación entre las tasas de respuesta de los que no responden y los que sí lo hacen. Se detecta fácilmente con la prueba t. Sin embargo, la regresión logística tendría relativamente poca información detallada sobre cómo cambia realmente la tasa de respuesta con la edad o bien tendría información no concluyente: el caso de la "separación completa" en la que todas las personas mayores responden de una manera y todas las personas más jóvenes de otra, pero en ese caso ambas pruebas tendrían normalmente valores p muy bajos.
Tenga en cuenta que el diseño experimental puede invalidar algunos de los supuestos de la prueba. Por ejemplo, si se selecciona a las personas según su edad en un diseño estratificado, la hipótesis de la prueba t (que cada grupo refleja una muestra aleatoria simple de edades) se vuelve cuestionable. Este diseño sugeriría confiar en la regresión logística. Si, en cambio, se tuvieran dos grupos, uno de los que no responden y otro de los que sí responden, y se seleccionaran aleatoriamente de entre ellos para determinar su edad, los supuestos de muestreo de la regresión logística serían dudosos, mientras que los de la prueba t se mantendrían. Ese diseño sugeriría utilizar alguna forma de prueba t.
(El segundo diseño puede parecer una tontería en este caso, pero en circunstancias en las que la "edad" se sustituye por alguna característica que es difícil, costosa o que requiere mucho tiempo para medirla, puede ser atractivo).