El definición del parámetro min_child_weight en xgboost se da como el:
suma mínima de peso de instancia (arpillera) necesaria en un niño. Si el paso de paso de partición del árbol resulta en un nodo hoja con la suma de peso de instancia peso de instancia menor que min_child_weight, entonces el proceso de construcción renunciará a renunciará a seguir partiendo. En el modo de regresión lineal, esto simplemente corresponde al número mínimo de instancias necesarias para estar en cada nodo. Cuanto mayor sea, más conservador será el algoritmo.
He leído bastantes cosas sobre xgboost incluyendo el papel original (véase la fórmula 8 y la que sigue a la ecuación 9), esta pregunta y la mayoría de las cosas que tienen que ver con xgboost que aparecen en las primeras páginas de una búsqueda en google. ;)
Básicamente, sigo sin entender por qué imponemos una restricción a la suma de la arpillera. Mi único pensamiento en el minuto del documento original es que se relaciona con la sección de boceto cuantil ponderado (y la reformulación como de la ecuación 3 pérdida cuadrada ponderada) que tiene $h_i$ como el "peso" de cada instancia.
Otra pregunta se refiere a por qué es simplemente el número de instancias en modo de regresión lineal. ¿Supongo que esto está relacionado con la segunda derivada de la ecuación de la suma de los cuadrados?