"Variable ficticia" y "variable indicadora" son etiquetas de uso frecuente para describir la pertenencia a una categoría con codificación 0/1; normalmente 0: No es miembro de la categoría, 1: Es miembro de la categoría.
El 26/11/2014 una búsqueda rápida en scholar.google.com (con comillas adjuntas) revela que "variable ficticia" se utiliza en unos 318.000 artículos, y "variable indicadora" se utiliza en unos 112.000 artículos. El término "variable ficticia" también tiene un significado en matemáticas no estadísticas de " variable vinculada ", lo que probablemente contribuya al mayor uso de la "variable ficticia" en los artículos indexados.
Mis preguntas relacionadas con el tema:
- ¿Son estos términos siempre sinónimos (dentro de la estadística)?
- ¿Se puede aplicar cualquiera de estos términos a otras formas de codificación categórica (por ejemplo codificación de efectos , Codificación Helmert, etc. )?
- ¿Qué razones estadísticas o disciplinarias hay para preferir un término a otro?
4 votos
Suelo utilizar "variable indicadora" para las condiciones binarias, por ejemplo, el sexo podría codificarse como
male
con valores1
o0
. Si hay una variable categórica con más de 2 categorías que luego se amplía en variables indicadoras para la pertenencia a cada nivel, utilizaría "variables ficticias" para describir ese conjunto de variables indicadoras.2 votos
Creo que te refieres a sexo puede ser codificado como 1 o 0, género es una construcción mucho más complicada. (por lo demás, el sexo también puede ser más complicado) ;)
2 votos
Punto bien entendido, editado para
sex
.2 votos
Suelo llamar a esta variable indicadora
male
donde 1 significa verdadero (en este caso masculino) y 0 falso (en este caso femenino). Si utilizo el nombre de la variablesex
Tendré que buscar cómo codifiqué esa variable cada vez que vuelva a ese conjunto de datos.4 votos
He oído varias historias en las que "variable ficticia" ha sido malinterpretada de forma salvaje y desafortunada por el público no técnico como si implicara desprecio o menosprecio. Fueron lo suficientemente vergonzosas y convincentes como para ponerme en contra del término. Para mí, "indicador" es claro y directo.
1 votos
@NickCox: ¿Utilizarías también "variable indicadora" para las variables ficticias en {-1,0,1} utilizadas para la codificación de suma a cero?
1 votos
@Scortchi No. Nunca he tenido que escribir sobre esas variables, pero buscaría alguna otra forma de informar sobre eso.
0 votos
@Scortchi ¿Tienes alguna referencia para entender la codificación de suma a cero?
1 votos
@Alexis: Ver stats.idre.ucla.edu/r/library/ (donde se llama "codificación de desviación", pero creo que "codificación de suma a cero" es más claro).