15 votos

¿Qué es el "uno-caliente" de la codificación de la llama en la literatura científica?

¿Cuál es el nombre del operador que toma un categórico vector y la transforma en la representación binaria utilizando una bañera de codificación? Me estoy preguntando desde que estoy escribiendo un artículo científico y la necesidad de un nombre propio por que.

21voto

Dipstick Puntos 4869

Los estadísticos de la llamada de una bañera de codificación dummy de codificación. Como otros sugirieron (incluyendo Scortchi en los comentarios), esto no es sinónimo exacto, pero este es el término que se usa generalmente para el 0-1 codificados de las variables categóricas.

Ver también: "Dummy variable" versus "indicador de la variable" nominal/datos categóricos

9voto

Rob Allen Puntos 486

Depende de tu público objetivo.

Como Tim dijo, los estadísticos llaman ficticio de codificación, y eso es lo que yo esperaría a ver cuando se describe algo así como un modelo de regresión. "Maniquí codificados de las variables fueron incluidas para ajustar la tienda de la ubicación." Creo que llamar es una caliente de codificación podría parecer un poco extraño aquí.

Sin embargo, como otra Tim también dijo que, de una bañera de codificación es bastante común en la máquina de aprendizaje de la literatura. Es débilmente implica la existencia de nodos (como en una red neuronal), cables físicos (en un dispositivo), o algo por el estilo, al menos para mí.

Formalmente, supongo que se está aplicando un conjunto de funciones de los indicadores $\mathbb{I}_X$, pero que probablemente es demasiado formal fuera de una prueba.

7voto

Aksakal Puntos 11351

El término proviene de la ingeniería electrónica. Sólo pensar que iba a llamar a 1 "caliente"? Sólo a los que trabajan con la electricidad, donde "caliente" o "vivir" significa que hay potencial eléctrico en el alambre. "Uno caliente" se refiere al diseño del circuito donde discreto nivel de la señal eléctrica en un alambre podría ser decodificado en caliente/fría en un conjunto de cables. Supongo que algunos de la máquina de aprendizaje de la gente con EE fondo de encontrar la analogía convincente.

En econometría y estadística puede encontrarse dummy o indicator variables, que son muy similares ya que estos se utilizan para representar las diferentes categorías con sus diferentes indicadores. Hay una sutil diferencia. Por ejemplo, hacer K-1 maniquíes para K categorías, debido a que la base categoría corresponde a todos los muñecos de establecer a 0. En cambio, yo creo que en un caliente de codificación tiene K cables, donde la categoría de base tendrá su propio hilo (variable).

5voto

denn Puntos 1

Estoy estadísticamente entrenados, y recientemente han oído hablar de "uno-caliente de codificación" en el aprendizaje de máquina/comp sci iluminado. He normalmente sólo se refiere a la hotted de la matriz como un diseño de la matriz de datos//matriz diseño de marco.

3voto

victor Puntos 1

Reconocimiento de patrones y Aprendizaje de Máquina por Christopher Obispo se utiliza el término de $1$de$K$ esquema.

Aquí está una cita de un libro,

Variables binarias puede ser utilizado para describir cantidades que puede tomar uno de dos valores posibles. A menudo, sin embargo, nos encontramos con variables discretas que puede tomar uno de $K$ posible mutuamente exclusiva de los estados. Aunque hay varias maneras alternativas de expresar tales variables, veremos en breve, una particular representación conveniente es el $1$de$K$ esquema en el que la variable está representada por una $K$-dimensiones del vector de $\textbf{x}$ en el que uno de los elementos $x_k$ es igual a $1$, y el resto de elementos de la igualdad de $0$. Así, por ejemplo, si tenemos una variable que puede tomar $K = 6$ a los estados y una observación particular de la variable pasa a corresponder a la del estado donde$x_3 = 1$, $\textbf{x}$ será representada por

$\textbf{x} = (0, 0, 1, 0, 0, 0)^{T}$

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X