Yo diría que la regresión logística no es una prueba en absoluto; sin embargo, una regresión logística puede dar lugar a ninguna prueba o a varias pruebas.
Tienes razón en que etiquetar algo como no paramétrico porque no es normal es insuficiente. Yo llamaría a la familia exponencial explícitamente paramétrica, por lo que normalmente consideraría la regresión logística (y la regresión de Poisson y la regresión Gamma y ...) como paramétrica, aunque puede haber circunstancias en las que podría aceptar un argumento de que determinadas regresiones logísticas podrían ser consideradas como no paramétricas (o al menos en un sentido vagamente ondulado, sólo cuasi "paramétricas").
Tenga cuidado con la confusión sobre los dos sentidos en los que una regresión puede llamarse no paramétrica.
Si me pongo un Theil lineal es no paramétrica en el sentido de que he dejado la distribución del error sin definir (corresponde a ajustar la pendiente de la regresión hasta que la correlación de Kendall entre los residuos y $x$ es 0) ... pero es paramétrico en el sentido de que tengo una relación totalmente especificada entre $y$ y $x$ parametrizado por los coeficientes de pendiente e intercepción.
Si por el contrario ajusto una regresión polinómica kernel (digamos una regresión lineal local), pero con errores normales, que también se denomina no paramétrico pero en este caso se trata de la parametrización de la relación entre $y$ y $x$ que es no paramétrica (al menos potencialmente infinita), no la distribución del error.
Se utilizan ambos sentidos, pero cuando se trata de una regresión, el segundo tipo se utiliza más a menudo.
Es también es posible ser no paramétrico en ambos sentidos, pero es más difícil (con datos suficientes, podría, por ejemplo, ajustar una regresión lineal ponderada localmente de Theil).
En el caso de los GLM, la segunda forma de regresión múltiple no paramétrica incluye los GAM; esa segunda forma es el sentido en el que Hastie suele operar (y bajo el que está operando en esa cita).
7 votos
(+1) Para que conste, y como contrapunto a las afirmaciones de la pregunta, no conozco ninguna referencia fiable que defina (o incluso caracterice) los métodos no paramétricos como "carentes de supuestos". Todo los procedimientos estadísticos hacen suposiciones. La mayoría de los procedimientos no paramétricos hacen realmente suposiciones cuantitativas restrictivas sobre las distribuciones de probabilidad subyacentes, pero esas suposiciones no reducen los posibles estados de cosas a un conjunto que tiene la estructura de una variedad real de dimensión finita.
0 votos
Si estamos hablando de una regresión logística lineal (lo que parece estar implícito, basándonos en la respuesta que has escrito) entonces, por supuesto, se trata de un modelo paramétrico, pero cabe destacar que si ajustas el efecto de la covariable utilizando una función suave no paramétrica, por ejemplo $$ \log \left( \frac{ P(Y_i = 1 | X_i = x) }{P(Y_i = 0 | X_i = x) } \right) = f(x) $$ entonces no hay restricciones paramétricas en la probabilidad estimada como función de $x$ . Esto no sólo es cierto para el enlace logístico; la misma lógica se aplica a cualquier función de enlace invertible.
1 votos
Hago una pregunta relacionada aquí . Estoy empezando a tener la sensación de que algunos Los casos del MLG (por ejemplo, un modelo logístico) proporcionan una prueba no paramétrica. Voy a consultar el libro de Wasserman, aunque (a menos que recuerde mal) hay cierto desacuerdo sobre algunos de los principios y conclusiones de su trabajo.