5 votos

Múltiples variables binomiales: probabilidad son todos 1

Hemos observado cuatro cabinas de teléfono por medio de la grabación, en un momento dado, si cada cabina de teléfono está ocupado (0 o 1). Tenemos aproximadamente 50 observaciones (es decir, en 50 diferentes puntos de tiempo, por lo que cada cabina de teléfono se registró 50 veces). Las observaciones fueron pre-planificado y espaciados lo suficientemente lejos como para ser independiente, los datos fueron registrados en un período de aproximadamente un mes. ¿Cómo puedo calcular un intervalo de confianza o creíble intervalo de la frecuencia de las cuatro cabinas de teléfono fueron ocupados?

Mi proceso de pensamiento y de las ideas:

La observación de cada una cabina de teléfono en un punto de tiempo dado es un ensayo de Bernoulli. Por lo que podemos modelo de una cabina de teléfono como una variable aleatoria binomial con probabilidad de $p$ de los ocupados. Hay varias maneras de calcular los intervalos de binomio variables (véase esta cuestión). El truco es que queremos cuando están llenos.

Ideas:

  1. Modelo de cada cabina de teléfono como un binomio. El uso de un $\text{Beta}(a, b)$ anterior, la posterior es$\text{Beta}(y+a, n-y+a) = \text{Beta}(y+a, 50-y+a)$, donde se observó $y$ veces estaba ocupado. A continuación, dibuje posterior de las muestras de los cuatro cabinas de teléfono por separado y se aproximan $p(\text{all four are occupied})$ contando la proporción de muestras para que los cuatro están ocupadas. Contras: asume las cuatro cabinas de teléfono son independientes, cuando en realidad no hay tal cosa como la hora pico vs tiempos de inactividad, así que debe haber algún tipo de correlación, tal vez incluso más relevante, ya que estamos interesados en la "oleada" períodos cuando todos están llenos.

  2. Igual que el anterior, pero como una normal multivariante para que una matriz de covarianza puede ser utilizado a fin de que las observaciones no se supone que para ser independiente. Contras: dudoso que el modelo normal es una buena aproximación de la binomial datos en pequeño $N$.

  3. En cualquier momento dado, 0, 1, 2, 3, o 4 cabinas de teléfono está ocupado. Así que el modelo de estas como una distribución multinomial (frecuentista, o con Dirichlet antes). Contras: No estoy seguro si esto captura la estructura ordenada 0 < 1 < 2 < 3 < 4, o si es necesario. Mi entendimiento es que multinomial es la intención de separar las categorías, como los candidatos políticos en las elecciones y usted desea ver los porcentajes de votación de cada uno basado en una muestra de votantes; no es seguro que se aplica a este caso.

2voto

avid Puntos 161

Si no me equivoco, en cada uno de los períodos de observación total 50, se observaron todas las cabinas de cuatro a la vez. Así que solo recodificar cada observación como 1 si todas las cuatro cabinas estaban ocupadas y 0 en caso contrario. Ahora tienes 50 sorteos de una distribución de Bernoulli y puede calcular intervalos de confianza y los intervalos creíbles la forma habitual.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X