"Categórico" no es un término matemático bien definido, por lo que para responder a esta pregunta tenemos que fijarnos en cómo se pretende utilizar esta palabra. Se emplea en contraste con "ordinal", "intervalo" y "razón". Una forma de entender las principales distinciones es en términos de los grupos de reexpresiones admisibles de los valores. En el caso de las tres últimas, hay un orden que debe preservarse, por lo que todas las reexpresiones deben ser monótonas (preservar el orden). Para las variables categóricas, cualquier biyección (incluidas las permutaciones) está bien:
Más allá de eso, todo vale con la escala nominal [categórica].
(Stevens, citado en el Artículo de Wikipedia .)
Otro concepto de "categórico" es que cada resultado debe poder distinguirse de todos los demás. Esto sugiere fuertemente que cualquier medida de probabilidad debe ser totalmente discreta: es decir, todos los subconjuntos son medibles, lo que implica que cada categoría tendrá su propia probabilidad bien definida. (Éste no es el caso de las distribuciones continuas).
Esto parecería indicar que el número de categorías debería ser finito o, como mucho, contable, pero esto no es evidente en la bibliografía. Por ejemplo, un ejemplo arquetípico de variable categórica es un conjunto de nombres. El conjunto de todos los nombres posibles en cualquier alfabeto finito es contable pero no finito. Por tanto, es útil permitir que los conjuntos contablemente infinitos sean categóricos. Por ejemplo, si estudiamos los nombres que se ponen a los bebés, es conveniente dejar que el espacio muestral consista en todos los posibles nombres (en lugar de todos los nombres que conocemos).
Un ejemplo algo menos realista, pero concebible, de variable categórica sería una que utilizara números reales como nombres. En efecto, una variable de este tipo ignoraría toda la estructura matemática habitual de este conjunto. No veo ningún problema con este uso, pero vale la pena observar que los axiomas de probabilidad implican que cualquier distribución de probabilidad válida en este contexto (a) asignaría un valor no negativo a cada número real y (b) asignaría un valor distinto de cero como máximo a una infinidad contable de los reales.
Una aplicación que implica un espacio muestral incontable que admite variables aleatorias categóricas de soporte infinito, incluso incontable, es el estudio de gráficos aleatorios . Para entender la tasa de crecimiento de alguna propiedad de los grafos, nos gustaría contemplar grafos en 0, 1, ..., $n$ ... nodos, por lo que es conveniente permitir que los grafos tengan un número contable de nodos. Las variables aleatorias definidas en este conjunto pueden ser de varios tipos. Por ejemplo, el grado medio de los vértices (si es finito) podría considerarse de tipo razón; el grado total de los vértices podría considerarse de tipo ordinal (y, por tanto -olvidando el orden- es un buen ejemplo de variable discreta contable). Si además permitimos que un grafo tenga un número arbitrario de aristas y nos interesan, digamos, sus componentes conectados, entonces tendríamos una categoría natural que es incontable (porque cada componente conectado determina el subconjunto de nodos que contiene y hay incontables subconjuntos de un conjunto contable).
En resumen, es razonable permitir que los valores categóricos alcancen una infinidad incontable de posible valores, reconociendo al mismo tiempo que como máximo un número contable de ellos podría haber probabilidades positivas. Este debe ser una distribución discreta, porque todos los subconjuntos son medibles, lo que no ocurre con las distribuciones continuas.
0 votos
¿Qué quiere decir "infinito contable"? Usando la definición de aquí: mathworld.wolfram.com/ContablementeInfinito.html En realidad no puedo concebir un ejemplo aplicado. ¿Te refieres a una variable que puede oscilar hacia + o - infinito?
0 votos
No. Me refiero a la cardinalidad del conjunto de los valores que puede tomar la variable categórica para los datos categóricos.
0 votos
No estoy seguro de que eso añadiera claridad ;) Voy a dar un golpe de todos modos.
0 votos
Creo que habría que replantear la pregunta ¿puede haber finitos niveles (o contablemente infinita) para una categórica variable . Categórica datos puede incluir infinitos valores - no hay razón para suponer que una observación tiene una cardinalidad determinada.