Estoy tratando de diseño para mí cuando es apropiado utilizar la regresión de tipo (geométricas, poisson, binomial negativa) con el conde de datos, dentro de los GLM (sólo 3 de los 8 GLM distribuciones se utilizan para datos de conteo, aunque la mayoría de todo lo que he leído se centra alrededor de la Negativa Binomial y de Poisson dist.'s).
Hasta ahora tengo la siguiente lógica:
Es el recuento de los datos?
Sí ->
Son la media y la varianza desigual?
Sí -> regresión binomial Negativa
No -> regresión de Poisson
Hay inflación cero?
Sí -> Cero Inflado de Poisson o Cero Inflado Binomial Negativa (Pregunta 1 no parece ser una clara indicación de que va a utilizar cuando. Hay algo para informarle de que la decisión? Por lo que entiendo, una vez que cambie a ZIP, la media de la variación de la igualdad de asunción obtener relajado, así que es bastante similar a la NOTA de nuevo.)
Pregunta 2 ¿de Dónde viene el geométrica de la familia ajuste en esto o qué tipo de preguntas que debería hacer de los datos a la hora de decidir si utilizar un geométrica de la familia en mi regresión?
He leído las entradas de wikipedia (lo que demuestra que este no es un frívolo saco pregunta, me gustaría una explicación en términos sencillos lo que demuestra/que explica cómo decidir entre estas distribuciones para el análisis de datos; de preferencia en el formato de la lógica de árbol que he demostrado más arriba)
Geométrica = se puede usar de 2 maneras:
La distribución de probabilidad del número X de ensayos de Bernoulli necesario para obtener un éxito, apoyado en el conjunto { 1, 2, 3, ...}
O
La distribución de probabilidad del número de Y = X − 1 de fallos antes del primer éxito, apoyado en el conjunto de { 0, 1, 2, 3, ... }.
Así:
Es la probabilidad de que la primera aparición de éxito requiere k número de ensayos independientes, cada uno con probabilidad de éxito p.
Y entiendo que:
La distribución geométrica es un caso especial de discretos Compuesto de Poisson la distribución.
Poisson =
Un discreto de la variable aleatoria X se dice que tiene una distribución de Poisson con el parámetro λ > 0, si, por k = 0, 1, 2, ...,.
Y entiendo que:
La distribución de Poisson es un caso especial de discretos compuesto de Poisson la distribución (o tartamudeo distribución de Poisson) con sólo un parámetro.
Binomial Negativa =
una discreta distribución de probabilidad del número de éxitos en una la secuencia de los independientes e idénticamente distribuidas ensayos de Bernoulli antes especificado (no aleatoria) número de fallos (denotado r) se produce. k ∈ { 0, 1, 2, 3, ... } - número de éxitos
La distribución binomial negativa es un caso especial de discretos Compuesto Poisson distribución discreto y fase-tipo de distribución.
Pregunta 3: veo a la gente intercambiando la Binomial Negativa y distribuciones de Poisson todo el tiempo, pero no Geométricos, así que supongo que hay algo claramente diferente acerca de cuándo usarlo. Si es así, ¿qué es?
P. S. He hecho una (probablemente simplificada, a partir de los comentarios de los) diagrama (editable) de mi comprensión actual si la gente quería comentar/ajustar para la discusión.