16 votos

¿Qué se entiende por distribución categórica?

¿Se trata de un tipo de distribución distinto (EX: Binomial,bernoulli, Multinomial) o de cualquier distribución que pueda representarse de esta manera? ¿Puede alguien explicar con un ejemplo sencillo

22voto

andynormancx Puntos 234

La distribución categórica es la generalización de la distribución Bernoulli a un número fijo $2 \le k$ de los resultados.

Equivalentemente, es el caso especial de la distribución multinomial donde el número de "elecciones" $n$ se fija en uno.

Por lo tanto, tiene pdf:

$$\prod_{i=1}^k p_i^{x_i} \qquad\text{(where $ 0 \le p_i $ and $\sum_i p_i = 1 $)}$$ sobre el soporte $$x_i \in \{0,1\}$$ donde $$n \triangleq \sum_{i=1}^k x_i = 1.$$

En resumen, Bernoulli tiene $k=2, n=1$ , el binomio tiene $k=2, n\ge 1$ , el multinomio tiene $k\ge2, n\ge1$ y categórico tiene $k\ge2, n=1$ .

0 votos

es necesario, xi=0,1. ¿No puede ser más que eso?

0 votos

@subha: Mi entendimiento de la distribución categórica lo tiene así. Para la multinomial y la binomial, por supuesto que puede ser.

7voto

Nick Stauner Puntos 8220

Las variables categóricas tienen conjuntos finitos de valores discretos. Algunos ejemplos son el sexo (masculino/femenino), el país, el planeta, etc. A diferencia de las variables continuas, que pueden tomar un número infinito de valores diferentes. Por ejemplo, el peso, la longitud, la distancia, etc.

Tenga en cuenta que a veces se puede expresar información similar de forma categórica y continua; por ejemplo planet = earth podría expresarse como distance to sun = 1 astronomical unit 150 million kilometers . Sin embargo, no hay realmente ninguna manera de expresar 200 millones de kilómetros del sol en términos de planetas, porque no hay ningún planeta allí (Marte está a 228 millones de km del sol). Lo mismo para 201 millones de km, 202, etc. Todo lo que se puede decir sobre estas distancias en términos de planetas es planet = none ; no podías decir planet = 4/3×earth o .88×Mars porque no hay una forma significativa de multiplicar un planeta o cualquier otra variable categórica. En términos de planetas, estas distancias serían indistinguibles, pero, por supuesto, tienen sentido como distancias distintas del sol cuando se expresan como tales, como una variable continua.

También se pueden expresar variables continuas con una precisión arbitraria (por ejemplo, una unidad astronómica es 149.597.871 km, no exactamente 150 millones de km). Por el contrario, no hay forma de expresar planet = earth más precisamente; la Tierra es exactamente la Tierra, ni más ni menos. Además, no tendría sentido decir que cualquier otro planeta es "más" o "menos" que la Tierra si planet es una variable nominal. Sin embargo, podría codificarse como una variable ordenada (ordinal): los planetas se ordenan en términos de distancia al sol, volumen, número de lunas, etc. Todos estos números son continuos en sus propios términos (o al menos los recuentos, que son discretos pero no categóricos), pero no en términos de planetas. Por ejemplo, si los planetas se ordenan por distancia al sol o por número de lunas, mars > earth > venus . Si los planetas se ordenan por volumen, earth > venus > mars . No es necesario ordenar las variables categóricas, y tal vez algunas no puedan ser ordenadas, pero añadir un orden no las hace menos categóricas.

Como dice la Wikipedia, las distribuciones categóricas son generalizaciones de la distribución Bernoulli a más de dos valores posibles (la distribución Bernoulli es estrictamente binaria). La distribución Bernoulli es también un caso especial de la distribución binomial, pero yo no llamaría categórica a la distribución binomial (es discreta, pero una variable de recuento, por lo que las distancias entre valores están definidas). Las distribuciones multinomiales pueden confundirse con las distribuciones categóricas, pero La Wikipedia advierte de ello .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X