20 votos

Debemos enseñar a la curtosis en estadística aplicada curso? Si es así, ¿cómo?

La tendencia Central, la propagación y la asimetría que pueden ser definidos relativamente bien, al menos sobre una base intuitiva; la matemática estándar de las medidas de estas cosas también se corresponden bastante bien a nuestras nociones intuitivas. Pero curtosis parece ser diferente. Es muy confuso y no encaja bien con cualquier intuición acerca de la distribución de la forma.

Una típica explicación de curtosis en un ajuste aplicado sería este extracto de estadística Aplicada para administración y negocios utilizando Microsoft Excel $^{[1]}$:

La curtosis se refiere a cómo el pico es una distribución o a la inversa, lo plana que es. Si hay más valores de datos en las colas, que lo que usted espera de una distribución normal, la curtosis es positivo. Por el contrario si hay menos valores de datos en la cola, en la que se puede esperar en una distribución normal, la curtosis es negativo. Excel no puede calcular este dato, a menos que usted tiene por lo menos cuatro valores de datos.

Aparte de la confusión entre el "aplanamiento" y "el exceso de curtosis" (como en este libro, es común el uso de la antigua palabra para referirse a lo que otros autor de la llamada a la segunda), la interpretación en términos de "peakedness" o "llanura", a continuación, oscurecida por el interruptor de atención a la cantidad de elementos de datos están en las colas. Teniendo en cuenta tanto la "pico" y "colas" es necesario — Kaplansky$^{[2]}$ se quejó en 1945, que muchos libros de texto de la época indican erróneamente curtosis fue a ver con qué tan alto el pico de la distribución se compara a la de una distribución normal, sin tener en cuenta las colas. Pero claramente la necesidad de tener en cuenta la forma, tanto en el pico y en las colas que hace la intuición más difícil de entender, un punto en el extracto citado más arriba salta por seguing de peakedness a la pesadez de las colas, como si estos conceptos son los mismos.

Además, este clásico de "pico y la cola" explicación de curtosis sólo funciona bien para simétrica y unimodal distribuciones (de hecho, los ejemplos ilustrados en ese texto son simétricas). Sin embargo, la "correcta" de manera general para interpretar la curtosis, ya sea en términos de "picos", "colas" o "hombros", se ha discutido por décadas.$^{[2][3][4][5][6]}$

Es allí una manera intuitiva de la enseñanza de la curtosis en un ajuste aplicado que no llegará a las contradicciones o contraejemplos cuando un enfoque más riguroso se toma? Es la curtosis incluso un concepto útil en el contexto de este tipo de análisis aplicado de datos de los cursos, en lugar de la estadística matemática clases? Si "peakedness" de una distribución es una forma intuitiva concepto útil, debemos enseñar es por medio de L-momentos$^{[7]}$ lugar?

$[1]$ Herkenhoff, L. y Hojas, J. (2013). Estadística aplicada para administración y negocios utilizando Microsoft Excel. Nueva York, NY: Springer.

$[2]$ Kaplansky, I. (1945). "Un error común sobre la curtosis". Revista de la Asociación Americana de Estadística, 40(230): 259.

$[3]$ Darlington, Richard B (1970). "Es La Curtosis Realmente 'Peakedness'?". El Estadístico Americano 24(2): 19-22

$[4]$ Moros, JJA. (1986) "El significado de la curtosis: Darlington reexaminado". El Estadístico Americano 40(4): 283-284

$[5]$ Balanda, Kevin P. y MacGillivray, H. L. (1988). "La Curtosis: Una Revisión Crítica". El Estadístico Americano 42(2): 111-119

$[6]$ DeCarlo, L. T. (1997). "Sobre el significado y el uso de curtosis". Métodos psicológicos, 2(3), 292. Chicago

$[7]$ Hosking, J. R. M. (1992). "Momentos o L momentos? Un ejemplo de la comparación de dos medidas de la distribución de la forma". El Estadístico Americano 46(3): 186-189

21voto

Pásztor Dávid Puntos 51

La curtosis es realmente muy sencillo ... y útil. Es simplemente una medida de los valores atípicos, o de las colas. No tiene nada que ver con el pico lo que la definición debe ser abandonada.

Aquí es un conjunto de datos:
0, 3, 4, 1, 2, 3, 0, 2, 1, 3, 2, 0, 2, 2, 3, 2, 5, 2, 3, 999

Observe que '999' es un valor atípico.

Aquí están las $z^4$ valores del conjunto de datos:

0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 0.00,0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 360.98

Tenga en cuenta que sólo el outlier da un $z^4$, que es notablemente diferente de 0.

El promedio de estos $z^4$ valores de la curtosis de la distribución empírica (restar 3 si te gusta, no importa por el momento me estoy haciendo): 18.05

Debería ser obvio a partir de este cálculo que los datos de cerca el "pico" (la no-datos atípicos) aportan casi nada a la curtosis estadístico.

La curtosis es útil como medida de los valores atípicos. Los valores atípicos son importantes para los estudiantes de primaria y, por tanto, la curtosis debe ser enseñado. Pero la curtosis tiene prácticamente nada que ver con el pico, si es puntiaguda, plana, bimodal o infinito. Usted puede tener todos los de arriba con los pequeños de la curtosis y todos los de arriba con los grandes de la curtosis. Por lo que debe NUNCA ser presentado como tener nada que ver con el pico, ya que será la enseñanza de la información incorrecta. También hace que el material innecesario confuso, y aparentemente menos útil.

Resumen:

  1. la curtosis es útil como una de las medidas de colas (outliers).
  2. la curtosis tiene nada que ver con el pico.
  3. la curtosis es útil en la práctica y debe ser enseñado, pero sólo como una medida de los valores atípicos. No mencionar pico, cuando la enseñanza de la curtosis.

En este artículo se explica claramente por qué el "Peakedness" definición ahora está oficialmente muerto.

Westfall, P. H. (2014). "La curtosis como Peakedness, 1905 – 2014. R. I. P." El Estadístico Americano, 68(3), 191-195.

6voto

kjetil b halvorsen Puntos 7012

Mientras que la pregunta es un poco vago, es interesante. ¿En qué niveles se curtosis enseñado? Recuerdo que fue mencionado en un (a nivel de maestría) curso en modelos lineales (hace mucho tiempo, basada en la primera edición de Seber del libro). No era un tema importante, pero no entra en temas como el estudio de la (falta de) la robustez de la prueba de razón de Verosimilitud (F-test) de igualdad de varianzas, donde (de la memoria) nivel correcto asintóticamente depende de tener la misma curtosis como la distribución normal, que es mucho suponer! Vimos a un papel (pero nunca he leído con detalles) http://www.jstor.org/stable/4615828?seq=1#page_scan_tab_contents por Oja, que intenta averiguar qué es lo que se conoce como asimetría, curtosis y realmente tales medidas.

¿Por qué me parece interesante? Porque he estado enseñando en américa latina, donde parece que la asimetría y la curtosis son impartidas por muchos como temas importantes, y tratando de decirle a los estudiantes de postgrado (muchos de economía) que la curtosis es una mala medida de la forma de una distribución (principalmente debido a la variabilidad del muestreo de la cuarta poderes simplemente es grande), era difícil. Yo estaba tratando de llegar a utilizar QQplots lugar. Así, a algunos de los comentaristas, sí, esto es enseñado someplaces, probablemente mucho más!

Debemos enseñar mejores técnicas para el estudio de las formas de las distribuciones! como QQplots. Y, si alguien todavía necesita medidas numéricas, de medidas basado en L-momentos son mejores. Voy a citar un pasaje del papel J R Estatista de la Soc B (1990) 52, Nş 1, pp 105--124 por J R M Hosking: "L-momentos: Análisis y Estimación de la Distribución mediante Combinación Lineal de Orden Estadísticas" en la página 109:

"Una alternativa justificación de estas interpretaciones de L-momentos puede estar basado en el trabajo de la Oja (1981), Oja definido intuitivamente razonable criterios para una distribución de probabilidad sobre la línea real al estar situados más a la derecha (más dispersos, más sesgado, más kurtotic) que otro. Un valor real funcionales de una distribución que preserva el orden parcial de las distribuciones implícitas por estos criterios, a continuación, puede razonablemente ser llamado una " medida de ubicación (dispersión, asimetría, curtosis)'. De ello se deduce inmediatamente de la Oja del trabajo que $\lambda_1$$\lambda_2$ , en la Oja de la notación, $\mu(F)$$\frac12 \sigma_1(F)$, son las medidas de localización y escala respectivamente. Hosking (1989) muestra que $\tau_3$ $\tau_4$ son, por Oja de los criterios, medidas de asimetría y la curtosis, respectivamente. "

(Por el momento, me refiero al papel de la defs de estas medidas, todos ellos están basados en L-momentos.) Lo interesante es que, la medida tradicional de la curtosis, basado en la cuarta momentos, es no una medida de curtosis en el sentido de Oja! (Voy a editar en referencias para que la reclamación cuando la puedo encontrar).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X