53 votos

Pruebas de hipótesis Bootstrap vs. Permutación

Existen varias técnicas populares de remuestreo, que se utilizan a menudo en la práctica, como el bootstrapping, la prueba de permutación, el jackknife, etc. Existen numerosos artículos y libros que tratan estas técnicas, por ejemplo Philip I Good (2010) Pruebas de hipótesis por permutación, paramétricas y Bootstrap

Mi pregunta es qué técnica de remuestreo ha ganado más popularidad y es más fácil de aplicar. ¿El bootstrapping o las pruebas de permutación?

89voto

Eero Puntos 1612

Ambos son populares y útiles, pero principalmente para usos diferentes. La prueba de permutación es mejor para probar hipótesis y el bootstrapping es mejor para estimar intervalos de confianza.

Las pruebas de permutación ponen a prueba una hipótesis nula específica de intercambiabilidad, es decir, que sólo el muestreo aleatorio/la aleatorización explica la diferencia observada. Este es el caso común de cosas como las pruebas t y ANOVA. También puede ampliarse a cosas como las series temporales (hipótesis nula de que no hay correlación serial) o la regresión (hipótesis nula de que no hay relación). Las pruebas de permutación pueden utilizarse para crear intervalos de confianza, pero requieren muchas más suposiciones, que pueden ser razonables o no (por lo que se prefieren otros métodos). La prueba de Mann-Whitney/Wilcoxon es en realidad un caso especial de una prueba de permutación, por lo que son mucho más populares de lo que algunos creen.

El bootstrap estima la variabilidad del proceso de muestreo y funciona bien para estimar los intervalos de confianza. Se puede hacer una prueba de hipótesis de esta manera, pero tiende a ser menos potente que la prueba de permutación para los casos en que se cumplen los supuestos de la prueba de permutación.

18voto

Patrick Burns Puntos 691

Si se utiliza R, todos ellos son fáciles de implementar. Véase, por ejemplo, http://www.burns-stat.com/pages/Tutor/bootstrap_resampling.html

Yo diría que hay una tercera técnica importante: la validación cruzada. Se utiliza para probar el poder predictivo de los modelos.

12voto

AdamSane Puntos 1825

Mi pregunta es qué técnica de remuestreo ha ganado más popularidad
¿Pruebas de arranque o de permutación?

  1. El Bootstrapping trata sobre todo de generar errores estándar de muestras grandes o intervalos de confianza; las pruebas de permutación, como su nombre indica, tratan sobre todo de hacer pruebas. (Sin embargo, cada una puede adaptarse para ser utilizada para la otra tarea).

  2. ¿Cómo podríamos juzgar la popularidad? Si nos fijamos en campos como la psicología y la educación, podemos encontrar un amplio uso de pruebas basadas en rangos, como Wilcoxon-Mann-Whitney, la prueba de rangos con signo, las pruebas de correlación de rangos, etc. Todas ellas son pruebas de permutación (por otro lado, hay muchos casos en los que se podrían utilizar pruebas de permutación de los datos originales, pero normalmente no se utilizan). En otras áreas de aplicación, las pruebas de permutación rara vez se utilizarían, pero la diferente popularidad entre las áreas de aplicación a veces dice más sobre la cultura local de cada área que sobre su utilidad.

¿más fácil de aplicar?

En muchos casos -especialmente en los más sencillos- son casi exactamente igual de fáciles: es esencialmente la diferencia entre el muestreo con reemplazo y el muestreo sin reemplazo.

En algunos de los casos más complejos, el bootstrapping es más fácil de hacer porque (mirándolo desde el punto de vista de las pruebas) funciona tan bien bajo la alternativa como el nulo (al menos las implementaciones ingenuas lo serán -- hacerlo para que funcione bien puede ser mucho más complicado).

Las pruebas de permutación exactas pueden ser difíciles en los casos más complejos porque una cantidad intercambiable adecuada puede ser inobservable - a menudo una cantidad casi intercambiable puede ser sustituida al precio de la exactitud (y de ser verdaderamente libre de distribución).

El bootstrap renuncia esencialmente al criterio de exactitud correspondiente (por ejemplo, la cobertura exacta de los intervalos) desde el principio, y en su lugar se centra en tratar de obtener una cobertura razonablemente buena en muestras grandes (a veces con menos éxito de lo que puede entenderse; si no lo ha comprobado, no asuma que su bootstrap da la cobertura que espera).

Las pruebas de permutación pueden funcionar con muestras pequeñas (aunque la elección limitada de los niveles de significación puede ser a veces un problema con muestras muy pequeñas), mientras que el bootstrap es una técnica de muestras grandes (si se utiliza con muestras pequeñas, en muchos casos los resultados pueden no ser muy útiles).

Rara vez los veo como competidores en el mismo problema, y los he utilizado en problemas reales (diferentes) - a menudo habrá una elección natural de cuál mirar.

Ambas cosas tienen sus ventajas, pero ninguna en una panacea. Si espera reducir el esfuerzo de aprendizaje centrándose sólo en uno de ellos, es probable que se decepcione: ambos son partes esenciales de la caja de herramientas de remuestreo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X