8 votos

¿Puedo tratar una cuenta variable de respuesta como variable continua y ejecución OLS?

Lo que aprendí del libro es la predicción de conteo es distinto de predicción de una variable continua. Por ejemplo, si queremos predecir Cuántos correos de una persona recibe por día, podemos utilizar regresión de Poisson.

¿Sin embargo, si el número de cuenta es grande (por ejemplo, si queremos predecir cuántos días son soleados en un año.), podemos simplemente lo tratamos como una variable continua? Cuando $\lambda$ es grande, la puedo utilizar distribución normal a la distribución de Poisson aproximada. ¿Estoy correcto?

3voto

kjetil b halvorsen Puntos 7012

Una variable aleatoria es una variable de conteo no sólo significa que se haya natural número de valores. Así, el número de días de sol en un año no es un recuento de variable aleatoria, ya que no es el resultado de un proceso de conteo. Probablemente, un día se declara soleado si algunos burocratic se cumplen los criterios, como por lo menos 5 horas de sol claro, o lo que sea. No es un recuento de eventos independientes. Ejemplos de recuento de datos es la siguiente: número de accidentes automovilísticos en nueva york, por día. Número de mortinatos en Guatemala, por día. Estos son de conteo de eventos independientes, lo que podría, en primera aproximación, se modelles a través de la distribución de Poisson o de poisson punto del proceso. No puedo ver el ejemplo de Poisson modelo al acecho detrás de número de días de sol! Por ejemplo, eche un vistazo a mi respuesta aquí: Bondad de ajuste y que el modelo a elegir de regresión lineal o de Poisson de Los argumentos utilizados no son irrelevantes en su caso.

Volviendo a tu pregunta, si "el conde es grande". No es la grandeza en sí que importa, la gran cuenta todavía podría ser de Poisson (pero grande cuenta en la práctica a menudo se agrupan y algunos más complicado modelo de poisson sería necesario). Para el número de días de sol en un año, puede asegurarse intentar ordinario de regresión lineal, como un punto de partida.

Explicar por qué el "número de días de sol" no es una variable de recuento. En primer lugar, el número de horas (lo suficientemente fuerte) sol se mide en las estaciones meteorológicas con un Campbell–Stokes de la grabadora, consulte https://en.wikipedia.org/wiki/Campbell%E2%80%93Stokes_recorder Se parecen a esto:

https://en.wikipedia.org/wiki/Campbell%E2%80%93Stokes_recorder

y funciona mediante un enfoque del sol en un clip de papel, y la grabación de un camino que hay cuando el sol es lo suficientemente fuerte. Entonces uno tiene que medir la longitud de la quemada camino. Que da una medida de la variable, no una variable de recuento! El proceso subyacente es el de la medición, no contando. Entonces esto se convierte en un binario soleado/no sol indicador arbitraria ("burocratic") de corte. Espero que esto es una explicación mejor de mi respuesta!

3voto

EdM Puntos 5716

En el nivel fundamental de la química y de la teoría atómica, se podría argumentar que el mundo es discretos en lugar de continua. Uno podría argumentar que las variables continuas son por sí mismos muy útil aproximaciones a un subyacente discretos de la realidad. Así que claramente es ACEPTAR a tratar cuenta como variables continuas. Lo hacemos todo el tiempo en la práctica.

Esto es diferente de la cuestión de si Poisson aproximaciones son adecuados para cualquier aplicación particular. La respuesta de @kjetil cubre bien.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X