3 votos

Reglas generales para elegir un número inicial de intervalos de clase y refinar esa elección (potencialmente de forma automática)

Me preguntaba si existen reglas generales (o algoritmos) establecidos que, dados un conjunto de observaciones, puedan ayudar:

  1. elegir un número inicial de intervalos de clase.
  2. ajustar esa elección a un número mejor.

Pude encontrar la idea de utilizar la raíz cuadrada de N, donde N es el número de observaciones, como una suposición inicial del número de intervalos de clase.

Gracias de antemano.

1voto

David Spillett Puntos 18934

La ayuda del comando R hist http://stat.ethz.ch/R-manual/R-patched/library/grDevices/html/nclass.html tiene algunas referencias a algoritmos para calcular el número de intervalos:

Sturges, H. A. (1926) La elección de un intervalo de clase. Journal of the American Statistical Association 21, 65–66.

Scott, D. W. (1979) Sobre histogramas óptimos y basados en datos. Biometrika 66, 605–610.

Freedman, D. y Diaconis, P. (1981) Sobre el histograma como estimador de densidad: teoría L_2. Zeitschrift für Wahrscheinlichkeitstheorie und verwandte Gebiete 57, 453–476.

0voto

David Spillett Puntos 18934

Ver también HOGG, David W. Recetas de análisis de datos: Elección de la división para un histograma. Artículo preimpreso arXiv:0807.4820, 2008.

El resumen:

Los puntos de datos se colocan en divisiones al crear un histograma, pero siempre se debe tomar una decisión sobre el número o el ancho de las divisiones. Esta decisión a menudo se toma de forma arbitraria o subjetiva, pero no necesita ser así. Se define y se emplea una probabilidad de jackknife o de validación cruzada de un dato como función objetivo escalar para la optimización de las ubicaciones y anchos de las divisiones. Se justifica el objetivo al estar relacionado con la utilidad del histograma para predecir futuros datos. El método funciona para datos o histogramas de cualquier dimensionalidad.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X