¿Cuál es el nombre del operador que toma un categórico vector y la transforma en la representación binaria utilizando una bañera de codificación? Me estoy preguntando desde que estoy escribiendo un artículo científico y la necesidad de un nombre propio por que.
Respuestas
¿Demasiados anuncios?Los estadísticos de la llamada de una bañera de codificación dummy de codificación. Como otros sugirieron (incluyendo Scortchi en los comentarios), esto no es sinónimo exacto, pero este es el término que se usa generalmente para el 0-1 codificados de las variables categóricas.
Ver también: "Dummy variable" versus "indicador de la variable" nominal/datos categóricos
Depende de tu público objetivo.
Como Tim dijo, los estadísticos llaman ficticio de codificación, y eso es lo que yo esperaría a ver cuando se describe algo así como un modelo de regresión. "Maniquí codificados de las variables fueron incluidas para ajustar la tienda de la ubicación." Creo que llamar es una caliente de codificación podría parecer un poco extraño aquí.
Sin embargo, como otra Tim también dijo que, de una bañera de codificación es bastante común en la máquina de aprendizaje de la literatura. Es débilmente implica la existencia de nodos (como en una red neuronal), cables físicos (en un dispositivo), o algo por el estilo, al menos para mí.
Formalmente, supongo que se está aplicando un conjunto de funciones de los indicadores $\mathbb{I}_X$, pero que probablemente es demasiado formal fuera de una prueba.
El término proviene de la ingeniería electrónica. Sólo pensar que iba a llamar a 1 "caliente"? Sólo a los que trabajan con la electricidad, donde "caliente" o "vivir" significa que hay potencial eléctrico en el alambre. "Uno caliente" se refiere al diseño del circuito donde discreto nivel de la señal eléctrica en un alambre podría ser decodificado en caliente/fría en un conjunto de cables. Supongo que algunos de la máquina de aprendizaje de la gente con EE fondo de encontrar la analogía convincente.
En econometría y estadística puede encontrarse dummy
o indicator
variables, que son muy similares ya que estos se utilizan para representar las diferentes categorías con sus diferentes indicadores. Hay una sutil diferencia. Por ejemplo, hacer K-1 maniquíes para K categorías, debido a que la base categoría corresponde a todos los muñecos de establecer a 0. En cambio, yo creo que en un caliente de codificación tiene K cables, donde la categoría de base tendrá su propio hilo (variable).
Reconocimiento de patrones y Aprendizaje de Máquina por Christopher Obispo se utiliza el término de $1$de$K$ esquema.
Aquí está una cita de un libro,
Variables binarias puede ser utilizado para describir cantidades que puede tomar uno de dos valores posibles. A menudo, sin embargo, nos encontramos con variables discretas que puede tomar uno de $K$ posible mutuamente exclusiva de los estados. Aunque hay varias maneras alternativas de expresar tales variables, veremos en breve, una particular representación conveniente es el $1$de$K$ esquema en el que la variable está representada por una $K$-dimensiones del vector de $\textbf{x}$ en el que uno de los elementos $x_k$ es igual a $1$, y el resto de elementos de la igualdad de $0$. Así, por ejemplo, si tenemos una variable que puede tomar $K = 6$ a los estados y una observación particular de la variable pasa a corresponder a la del estado donde$x_3 = 1$, $\textbf{x}$ será representada por
$\textbf{x} = (0, 0, 1, 0, 0, 0)^{T}$