32 votos

Estrategias para la enseñanza de la distribución muestral

La versión resumida ¿Qué estrategias empleas con éxito para enseñar la distribución muestral (de una media muestral, por ejemplo) en un nivel de grado introductorio?

Los antecedentes

En septiembre impartiré un curso de introducción a la estadística para estudiantes de segundo curso de ciencias sociales (principalmente ciencias políticas y sociología) utilizando La práctica básica de la estadística por David Moore. Será la quinta vez que imparta este curso y un problema que siempre he tenido es que los estudiantes se han esforzado mucho con la noción de la distribución de muestreo . Se trata de los antecedentes de la inferencia y sigue una introducción básica a la probabilidad con la que no parecen tener problemas después de algunos contratiempos iniciales (y por básico, me refiero a básico -- Al fin y al cabo, muchos de estos estudiantes se han auto-seleccionado en una corriente de cursos específica porque intentaban evitar cualquier cosa que tuviera una vaga insinuación de "matemáticas"). Creo que el 60% de los alumnos abandona el curso sin comprender nada o mínimamente, el 25% entiende el principio pero no las conexiones con otros conceptos, y el 15% restante lo entiende completamente.

La cuestión principal

El problema que parecen tener los estudiantes es con la aplicación. Es difícil explicar cuál es el problema exacto, aparte de decir que simplemente no lo entienden. A partir de una encuesta que realicé el semestre pasado y de las respuestas a los exámenes, creo que parte de la dificultad es la confusión entre dos frases relacionadas y que suenan de forma similar (distribución muestral y distribución de la muestra), por lo que ya no utilizo la frase "distribución muestral", pero seguramente es algo que, aunque confuso al principio, se entiende fácilmente con un poco de esfuerzo y, de todas formas, no puede explicar la confusión general del concepto de una distribución muestral.

(Me doy cuenta de que puede ser yo ¡y mi enseñanza que está en cuestión aquí! Sin embargo creo que ignorar esa incómoda posibilidad es razonable ya que algunos los estudiantes parecen entenderlo y, en general, todo el mundo parece hacerlo bastante bien...)

Lo que he probado

Tuve que discutir con el administrador de la licenciatura en nuestro departamento para introducir sesiones obligatorias en el laboratorio de informática pensando que las demostraciones repetidas podrían ser útiles (antes de que empezara a enseñar este curso no había informática). Aunque creo que esto ayuda a la comprensión global del material del curso en general, no creo que haya ayudado con este tema específico.

Una idea que he tenido es simplemente no enseñarla en absoluto o no darle mucha importancia, una posición defendida por algunos (por ejemplo Andrew Gelman ). No encuentro esto particularmente satisfactorio, ya que tiene el tufillo de enseñar al mínimo común denominador y, lo que es más importante, niega a los estudiantes fuertes y motivados que quieren aprender más sobre la aplicación de la estadística la posibilidad de entender realmente cómo funcionan los conceptos importantes (¡no sólo la distribución de muestreo!). Por otra parte, el estudiante medio parece entender los valores p, por ejemplo, así que tal vez no necesite entender la distribución de muestreo.

La pregunta

¿Qué estrategias empleas para enseñar la distribución muestral? Sé que hay materiales y debates disponibles (por ejemplo aquí y aquí y este documento que abre un Archivo PDF ), pero me pregunto si puedo obtener algunos ejemplos concretos de lo que funciona para la gente (o supongo que incluso lo que no funciona para saber que no debo intentarlo). Mi plan ahora, mientras planifico mi curso para septiembre, es seguir el consejo de Gelman y "quitarle importancia" a la distribución de muestreo. Lo enseñaré, pero aseguraré a los alumnos que se trata de una especie de tema sólo para información y que no aparecerá en el examen (¿excepto quizás como pregunta extra?). Sin embargo, estoy muy interesado en escuchar otros enfoques que la gente haya utilizado.

25voto

Sean Hanley Puntos 2428

En mi opinión, las distribuciones muestrales son la idea clave de la estadística 101. Es mejor saltarse el curso que saltarse ese tema. Sin embargo, estoy muy familiarizado con el hecho de que los estudiantes simplemente no lo entienden, aparentemente no importa lo que usted haga. Tengo una serie de estrategias. Pueden llevar mucho tiempo, pero recomiendo saltarse/abreviar otros temas, para asegurarse de que captan la idea de la distribución muestral. Estos son algunos consejos:

  • Dígalo claramente: En primer lugar, menciono explícitamente que hay tres distribuciones diferentes de las que nos ocupamos: la distribución de la población, la distribución de la muestra y la distribución del muestreo. Lo digo una y otra vez a lo largo de la lección, y luego una y otra vez a lo largo del curso. Cada vez que digo estos términos hago hincapié en la terminación distintiva: sam- ple samp ling . (Sí, los alumnos se hartan de esto; también entienden el concepto).

  • Utilice imágenes (figuras): Tengo un conjunto de cifras estándar que utilizo cada vez que hablo de esto. Tiene las tres distribuciones representadas de forma clara, y típicamente etiquetadas. (Las etiquetas que acompañan a esta figura están en la diapositiva de PowerPoint e incluyen breves descripciones, por lo que no se muestran aquí, pero obviamente es: población en la parte superior, luego muestras, luego distribución muestral).
    enter image description here

  • Dé a los alumnos actividades: La primera vez que introduzcas este concepto, trae un rollo de monedas de cinco centavos (algunas monedas pueden desaparecer) o un puñado de dados de 6 caras. Haz que los alumnos se formen en pequeños grupos y generen un conjunto de 10 valores y los promedien. Luego puede hacer un histograma en la pizarra o con Excel.

  • Utilizar animaciones (simulaciones): Escribo algún código (cómicamente ineficiente) en R para generar datos y mostrarlos en acción. Esta parte es especialmente útil cuando se pasa a explicar el Teorema Central del Límite. (Obsérvese el Sys.sleep() declaraciones, estas pausas me dan un momento para explicar lo que sucede en cada etapa).

    N = 10 number_of_samples = 1000

    iterations = c(3, 7, number_of_samples)
    breakpoints = seq(10, 91, 3)
    meanVect = vector()
    x = seq(10, 90)
    height = 30/dnorm(50, mean=50, sd=10)
    y = height*dnorm(x, mean=50, sd=10)

    windows(height=7, width=5)
    par(mfrow=c(3,1), omi=c(0.5,0,0,0), mai=c(0.1, 0.1, 0.2, 0.1))

    for(i in 1:iterations[3]) {
    plot(x,y, type="l", col="blue", axes=F, xlab="", ylab="")
    segments(x0=20, y0=0, x1=20, y1=y[11], col="lightgray")
    segments(x0=30, y0=0, x1=30, y1=y[21], col="gray")
    segments(x0=40, y0=0, x1=40, y1=y[31], col="darkgray")
    segments(x0=50, y0=0, x1=50, y1=y[41])
    segments(x0=60, y0=0, x1=60, y1=y[51], col="darkgray")
    segments(x0=70, y0=0, x1=70, y1=y[61], col="gray")
    segments(x0=80, y0=0, x1=80, y1=y[71], col="lightgray")
    abline(h=0)

    if(i==1) {
    Sys.sleep(2)
    }
    sample = rnorm(N, mean=50, sd=10)
    points(x=sample, y=rep(1,N), col="green", pch="*")

    if(i<=iterations[1]) {
    Sys.sleep(2)
    }
    xhist1 = hist(sample, breaks=breakpoints, plot=F)
    hist(sample, breaks=breakpoints, axes=F, col="green", xlim=c(10,90),
    ylim=c(0,N), main="", xlab="", ylab="")
    if(i==iterations[3]) {
    abline(v=50)
    }

    if(i<=iterations[2]) {
    Sys.sleep(2)
    }
    sampleMean = mean(sample)
    segments(x0=sampleMean, y0=0, x1=sampleMean,
    y1=max(xhist1$counts)+1, col="red", lwd=3)

    if(i<=iterations[1]) {
    Sys.sleep(2)
    }
    meanVect = c(meanVect, sampleMean)
    hist(meanVect, breaks=x, axes=F, col="red", main="",
    xlab="", ylab="", ylim=c(0,((N/3)+(0.2*i))))
    if(i<=iterations[2]) {
    Sys.sleep(2)
    }
    }

    Sys.sleep(2)
    xhist2 = hist(meanVect, breaks=x, plot=F)
    xMean = round(mean(meanVect), digits=3)
    xSD = round(sd(meanVect), digits=3)
    histHeight = (max(xhist2$counts)/dnorm(xMean, mean=xMean, sd=xSD))
    lines(x=x, y=(histHeight*dnorm(x, mean=xMean, sd=xSD)),
    col="yellow", lwd=2)
    abline(v=50)

    txt1 = paste("population mean = 50 sampling distribution mean = ",
    xMean, sep="")
    txt2 = paste("SD = 10 10/sqrt(", N,") = 3.162 SE = ", xSD,
    sep="")
    mtext(txt1, side=1, outer=T)
    mtext(txt2, side=1, line=1.5, outer=T)

  • Reforzar estos conceptos a lo largo del semestre: Vuelvo a sacar la idea de la distribución muestral cada vez que hablamos del siguiente tema (aunque normalmente sólo muy brevemente). El lugar más importante para esto es cuando enseño ANOVA, ya que el caso de la hipótesis nula es realmente la situación en la que se muestrea de la misma distribución de la población varias veces, y su conjunto de medias de grupo es realmente una distribución de muestreo empírica. (Para un ejemplo de esto, vea mi respuesta aquí: ¿Cómo funciona el error estándar? .)

8voto

Craig Fisher Puntos 435

He tenido algo de suerte recordando a los alumnos que la distribución muestral es la distribución de la estadística de la prueba basada en un muestra aleatoria . Pido a los alumnos que piensen en lo que ocurriría si el propio proceso de muestreo estuviera sesgado, centrándose en los casos extremos. Por ejemplo, cómo sería la "distribución del muestreo" si nuestro proceso de muestreo eligiera siempre el mismo subconjunto (especial). A continuación, consideraría cómo sería la "distribución del muestreo" si nuestro proceso de muestreo sólo eligiera dos subconjuntos específicos (especiales) (cada uno con probabilidad 1/2). Esto es bastante sencillo de calcular con la media de la muestra (especialmente para determinadas elecciones de "especial" para la población subyacente).

Creo que para algunos estudiantes (claramente no todos) esto parece ayudarles con la idea de que la distribución del muestreo puede ser muy diferente de la distribución de la población. También he utilizado el ejemplo del teorema central del límite que mencionó Michael Chernick con cierto éxito, especialmente con distribuciones que no son claramente normales (las simulaciones parecen ayudar realmente).

7voto

Eero Puntos 1612

Vuelvo a empezar con la enseñanza de la probabilidad. No entro en muchas definiciones y reglas formales (no tengo tiempo suficiente), sino que muestro la probabilidad mediante la simulación. El problema de Monty Hall es un buen ejemplo, en el que muestro a través de la simulación (y luego sigo con la lógica) que la estrategia de cambiar da una mayor probabilidad de ganar. Señalo que mediante la simulación pudimos jugar el juego muchas veces (sin riesgo ni recompensa) para evaluar las estrategias y eso nos permite elegir la mejor estrategia (si alguna vez nos encontramos en esa situación). Elegir la mejor estrategia no garantiza la victoria, pero nos da una mejor oportunidad y ayuda a elegir entre las estrategias. A continuación, señalo que la forma en que esto se aplicará al resto del curso es que nos ayudará a elegir estrategias en las que hay un componente aleatorio, pero en situaciones más realistas en las que nos encontraremos.

Luego, cuando introduzco la distribución de muestreo, vuelvo a empezar con la simulación y digo que queremos desarrollar estrategias. Al igual que con el problema de Monty Hall, en la vida real sólo podremos tomar una muestra, pero podemos simular un montón de muestras para ayudarnos a desarrollar una estrategia. A continuación, muestro simulaciones de muchas muestras de la misma población (población conocida en este caso) y muestro las relaciones que aprendemos de las simulaciones (histograma de las medias de las muestras), es decir, las medias de las muestras se agrupan en torno a la media real (la media de las medias es la media), una desviación estándar más pequeña de la distribución de las muestras para las muestras más grandes, más normal para las muestras más grandes. Todo el tiempo hablo de repetir las ideas de la simulación para elegir estrategias, justo la misma idea del problema de Monty Hall aplicada ahora a las medias muestrales en lugar de a los juegos. Luego muestro las reglas oficiales y digo que además de las simulaciones se pueden demostrar matemáticamente, pero no voy a infligir las pruebas a toda la clase. Les ofrezco que si realmente quieren ver las pruebas matemáticas pueden venir a una hora de oficina y les mostraré las matemáticas (nadie de las clases de introducción me ha aceptado todavía).

Luego, cuando lleguemos a la inferencia, digo que sólo podremos tomar 1 muestra en el mundo real, al igual que sólo podríamos jugar al juego 1 vez (como máximo), pero podemos utilizar las estrategias que hemos aprendido al simular muchas muestras para desarrollar una estrategia (prueba z, prueba t o fórmula CI) que nos dé las propiedades elegidas (probabilidad de ser correctas). Al igual que con el juego, no sabemos antes de empezar si nuestra conclusión final será correcta (y normalmente seguimos sin saberlo después), pero sí sabemos por las simulaciones y la distribución de las muestras cuál es la probabilidad a largo plazo utilizando esa estrategia.

¿el 100% de los alumnos lo entienden perfectamente? no, pero creo que más de uno se hace a la idea general de que podemos utilizar la simulación y las reglas matemáticas (que se alegran de no tener que mirar, sólo confiar en el libro/instructor) para elegir una estrategia/fórmula que tenga las propiedades deseadas.

3voto

mat_geek Puntos 1367

Este es un tema muy importante y bien pensado por su parte. Creo que el concepto de distribución muestral es muy básico para entender la inferencia y, sin duda, debería enseñarse.

He impartido muchos cursos de introducción a la estadística, especialmente de bioestadística. Enseño el concepto de distribución de muestreo y tengo enfoques que creo que son buenos, pero realmente no tengo una buena retroalimentación para determinar el éxito que he tenido con ellos. De todos modos, esto es lo que hago.

Primero intento dar una definición sencilla. La distribución muestral es la distribución que tendría la estadística de la prueba si el proceso de muestreo se repitiera muchas veces. Depende de la distribución de la población de la que se supone que se generan los datos.

Aunque creo que esta es la definición más sencilla que puedo dar, me doy cuenta de que no es muy simple y que la comprensión del concepto no será inmediata en la mayoría de los casos. Por lo tanto, sigue esto con un ejemplo básico que refuerza lo que se dice con la definición.

El ejemplo que utilizaría es una muestra de tamaño n que es independiente e idénticamente distribuida como una distribución normal con media μ y varianza σ $^2$ entonces la media muestral que se utiliza como estimación puntual de la media o se utiliza para formar un estadístico de prueba para la media tiene una distribución muestral que es normal con media μ y varianza σ $^2$ /n.

A continuación, me gustaría seguir con una aplicación importante, el teorema del límite central. En términos sencillos, el teorema del límite central dice que, para muchas distribuciones que no son normales, la distribución muestral de la media de la muestra se aproximará a una distribución normal cuando el tamaño de la muestra n sea grande. Para ilustrar esto, tomemos distribuciones como la uniforme (una distribución bimodal también sería buena) y mostremos cómo es la distribución muestral de la media para tamaños de muestra de 3, 4, 5, 10 y 100. El estudiante puede ver cómo la forma de la distribución cambia de algo que no parece normal en absoluto para n pequeño a algo que se parece mucho a una distribución normal para n grande.

Para convencer a los alumnos de que estas distribuciones muestrales tienen realmente estas formas, pídales que realicen simulaciones en las que generen muchas muestras de distintos tamaños y calculen las medias muestrales. A continuación, pídales que generen histogramas para estas estimaciones de la media. También sugeriría aplicar una demostración física que muestre cómo funciona esto utilizando un tablero de quincunce. Al hacerlo, señale cómo el dispositivo genera muestras de la suma de ensayos Bernoulli independientes en los que la probabilidad de ir a la izquierda o a la derecha en cada nivel es igual a 1/2. Las pilas resultantes en la parte inferior representan un histograma para esta distribución de muestreo (la binomial) y se puede ver que su forma es aproximadamente normal después de que un gran número de bolas caiga en la parte inferior del quincunx, una demostración de la versión DeMoivre-Laplace del teorema del límite central a través de distribuciones de smapling.

1voto

Beerdude26 Puntos 46

Creo que sería bueno poner una "población" de números en una bolsa (que van, por ejemplo, del 1 al 10). Puedes hacer tus propias fichas, o utilizar monedas, naipes, etc.

Haz que los alumnos se sienten en grupos (5 o más) y que cada uno saque un número de la bolsa. A continuación, cada grupo calcula el valor medio de su grupo. Diles que antes has calculado la media de la población, que la has representado en un histograma y que pidas a un miembro de cada grupo que venga a representar su media muestral en un historgrama alrededor de ésta. Haz que hagan este ejercicio varias veces para "construir el histograma".

A continuación, podrás mostrar gráficamente la variación de las medias muestrales en torno a la media poblacional. Calcule la variación de las medias muestrales en comparación con la media de la población. Creo que los alumnos recuerdan claramente la realización de un ejercicio práctico de este tipo y, como resultado, el concepto de variación muestral les resultará más fácil. Puede sonar un poco infantil, pero a veces a los alumnos les gusta hacer algo activo: ..... No hay muchas oportunidades de hacer esto en estadística.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X