23 votos

Símbolo de intercalación re-métodos de muestreo

Estoy usando la librería caret R a diversas pruebas de modelado de procedimientos.

El trainControl objeto permite especificar una re-método de muestreo. Los métodos que se describen en la documentación de la sección 2.3, e incluyen: boot, boot632, cv, LOOCV, LGOCV, repeatedcv y oob. Aunque algunos de estos son fáciles de deducir, no todos estos métodos están claramente definidos.

¿Cuáles son los procedimientos correspondientes a estos métodos de remuestreo?

22voto

Marc-Andre R. Puntos 789

Ok, aquí está mi trate de:

  • de arranque - arranque
  • boot632 -- 0.632 bootstrap
  • cv -- validación cruzada, probablemente esto se refiere a K-fold cross-validation.
  • LOOCV-dejar-uno-fuera de la validación cruzada, también conocido como jacknife.
  • LGOCV - --grupo a cabo la validación cruzada, variante de LOOCV de datos jerárquicos.
  • repeatedcv -- es, probablemente, repetido al azar sub-muestreo de validación, yo.e la división de tren y de los datos de prueba se realiza en forma aleatoria.
  • oob-se refiere a fuera de la bolsa de estimación propuesto por Breiman, que además está relacionado con la agregación de bootstrap. (El archivo en el enlace no es un archivo ps, pero con una ganancia de ps.Z de archivo, cambiar el nombre y, a continuación, intente abrir.)

5voto

tigergopro Puntos 41

El repeatedcv se repite 10–fold cross–validation para que, según Max Kuhn presentación. El valor predeterminado de remuestreo esquema es el bootstrap.

Un buen archivo que se puede leer acerca de los métodos de remuestreo es el modelo de Predicción con R y el símbolo de intercalación Paquete (pdf). Max, presentaron esta en "usuario! De 2013".

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X