2 votos

Valor p de la respuesta multivariante en partykit::ctree

Me pregunto si alguien puede ayudarme a entender las dos preguntas relacionadas con partykit::ctree :

  1. ¿cuál es la diferencia entre "cuadrático" y "máximo" en ctree_control(teststat = c("quadratic", "maximum")) ? ¿Cuándo debo utilizar uno y otro?

  2. Para la respuesta multivariante, ¿qué significa el valor p en cada nodo de división, por separado para la regresión y la clasificación? He aquí un ejemplo para la clasificación:

    library(partykit) airq <- subset(airquality, !is.na(Ozone)) airct2 <- ctree(Ozone + Temp ~ ., data = airq) airct2 plot(airct2)

1voto

Daniel Lew Puntos 39063

La mayor parte de esto es un duplicado de: ¿Estadísticas de prueba utilizadas para un árbol de regresión de inferencia condicional?

Para más detalles, véase vignette("LegoCondInf", package = "coin") (o doi:10.1198/000313006X118430 ).

En cuanto a la pregunta "quadratic" contra. "maximum" : En el caso de dos variables de respuesta numéricas, la primera será normalmente más potente si la media de ambas variables de respuesta difiere para cada división encontrada en el árbol. Por el contrario, si hay muchas divisiones en las que sólo cambia una u otra media de las respuestas pero la otra media permanece constante, la prueba máxima puede tener una potencia algo mayor. Por supuesto, en la práctica, normalmente no se sabe (antes de ajustar el árbol) en qué situación se encuentra.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X