El algoritmo AdaBoost dice que es para entrenar un clasificador basado en los datos de entrenamiento de acuerdo a un vector de peso.
Suponga que el tamaño de los datos de entrenamiento es N, el peso vectorial es de dimensión N así. Tengo tres preguntas con respecto a este procedimiento de muestreo,
1) el tamaño de la muestra de los datos de la misma como el conjunto de datos original? 2) ¿Cuál es el vector de peso? Si se trata de una distribución, entonces la suma de ellos tiene que ser 1. Es posible tener un peso de vectores con entradas de número entero? 3) en General, el algoritmo que puede ser utilizado para una muestra de un conjunto de datos basado en un peso dado de vectores o de una distribución?