¿Cuáles son las variable/selección de características que usted prefiere para la clasificación binaria cuando hay muchas más variables/característica de observaciones en el aprendizaje? El objetivo aquí es para hablar de lo que es la característica del procedimiento de selección que reduce el mejor el error de clasificación.
Podemos arreglar las notaciones de la coherencia: para $i \in \{0, 1\}$, deje que $\{x_1^i,\dots, x_{n_i}^i\}$ ser el aprendizaje de un conjunto de observaciones del grupo i$$. Por lo que $n_0 + n_1 = $ n es el tamaño del aprendizaje conjunto. Ponemos $p$ a ser el número de características (es decir, la dimensión del espacio de características). Deje que $x[i]$ denotar el $i$-ésima coordenada de $x \in \mathbb{R}^p$.
Por favor, dar las referencias completas si no puede dar los detalles.
EDICIÓN (actualizada continuamente): los Procedimientos propuestos en las respuestas a continuación
- Codicioso adelante selección de la Variable de proceso de selección para la clasificación binaria
- La eliminación hacia atrás Variable procedimiento de selección para la clasificación binaria
- Metrópolis de escaneo / MCMC Variable procedimiento de selección para la clasificación binaria
- penalizado de regresión logística de la Variable de proceso de selección para la clasificación binaria
Como este es el wiki de la comunidad puede haber más discusión y actualización de
Tengo una observación: en cierto sentido, todos dan un procedimiento que permitan el ordenamiento de las variables, pero no de selección de variables (que son bastante evasivo sobre cómo seleccionar el número de la cuenta, supongo que todo el uso de la validación cruzada?) Se puede mejorar las respuestas en esta dirección? (ya que este es el wiki de la comunidad no necesita ser la respuesta escritora para agregar información acerca de cómo seleccionar el número de variables? He abierto una pregunta en esta dirección aquí validación Cruzada en muy alta dimensión (para seleccionar el número de variables utilizadas en muchas dimensiones de clasificación))