57 votos

Conceptos estadísticos visualmente interesantes y fáciles de explicar

He visto en Math Stack Exchange un un hilo conductor estupendo en el que se destacan una serie de conceptos matemáticos muy interesantes desde el punto de vista visual. Tendría curiosidad por ver los gráficos/gifs que alguien tenga que ilustren muy claramente un concepto estadístico (sobre todo los que puedan servir de motivación para los estudiantes que se inician en la estadística).

Estoy pensando en cosas en la línea de cómo vídeos de un tablero Galton hacen que el CLT sea inmediatamente relacionable.

42voto

Alan Puntos 7273

Me gustan las imágenes que ilustran cómo diferentes patrones pueden tener una correlación similar. Las que siguen son de artículos de Wikipedia sobre correlación y dependencia

enter image description here

y El cuarteto de Anscombe con correlaciones de aproximadamente $0.816$

enter image description here

35voto

user275439 Puntos 41

La paradoja de Simpson

Fenómeno que aparece cuando se omite una variable clave en el análisis de una relación entre una o varias variables independientes y una variable dependiente. Por ejemplo, esto muestra cuantas más habitaciones tengan las casas, menor será el precio de la vivienda :

Average Home Price vs. Avg Number of Bedrooms

lo que parece contraintuitivo, y se resuelve fácilmente trazando todos los puntos de datos que componen la media de cada zona, en el mismo gráfico. En este caso, el mayor número de dormitorios indica correctamente viviendas más caras al observar también la variable del barrio:

Home Price vs. Number of Bedrooms

Si quiere leer más sobre el ejemplo anterior y obtener una explicación mucho mejor que la que yo he podido dar, haga clic en aquí .

29voto

chris Puntos 21

Uno de los conceptos más interesantes que son muy importantes hoy en día y muy fáciles de visualizar es " sobreajuste ". El clasificador verde de abajo presenta un claro ejemplo de sobreajuste [Editar: "el clasificador verde viene dado por la línea muy ondulada que separa los puntos de datos rojos y azules" - Nick Cox].

Desde Wikipedia :

enter image description here

25voto

Kate YAN Puntos 13

¿Cómo funciona un conjunto de datos 2D en el que la media de X es de 54 con una DE de 17, y la de Y de 48 y 27, respectivamente, y la correlación entre ambas es de -0,06?

Presentación de la Anscombosaurus :

enter image description here

Y su compañero, el Docena Datasaurus :

enter image description here

20voto

Chris Cleeland Puntos 2199

Creo que las correlaciones espurias también merecen su propio post. Es decir, correlación no es igual a causalidad. Quizás una de las cosas que más se utilizan cuando se intenta torcer la verdad utilizando la estadística. Tyler Vigen tiene un sitio web famoso con muchos ejemplos. Para ilustrarlo, véase el gráfico siguiente, en el que el número de casos de polio y las ventas de helados están claramente correlacionados. Pero suponer que la poliomielitis causa las ventas de helados o al revés es claramente un sinsentido. Polio causes ice cream

P.D: Relevante xkcd 1 y relevante xkcd 2

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X