6 votos

Por qué bootstrap?

He comprendido que el bootstrapping es una técnica utilizada para la estimación de las estadísticas de una población. En el arranque tomamos muchas muestras de tamaño elegido, la estimación de estadísticas y obtener la media de estas estadísticas. Esto significa que es representativa de toda la población.

Mi duda es que ¿por qué tomar las muestras en el primer lugar. Si usted tiene el conjunto de la población con usted, calcular las estadísticas en conjunto para que usted obtenga el 100% de precisión de las estadísticas?

10voto

James Puntos 21

Bienvenido a CV!

En el arranque, que en repetidas ocasiones a la toma de muestras con reemplazo de la muestra original. La idea general detrás de esto es que si usted puede hacer una estimación de la incertidumbre en la muestra mediante la siguiente pregunta: ¿Qué pasa si yo no observar esta observación, o de que uno, o si he observado esta observación, más de una vez?

De hacer esto, dicen, $B = 1,000$ veces y terminar con $1,000$ ligeramente diferentes estimaciones de la estadística de interés. Dependiendo de lo fuerte que la calculada estadística se ve afectada por esto, la varianza de su bootstrap estadística será más grande.

De hecho, resulta que el estándar de la desviación de la bootstrapped estadística puede ser un buen estimador de la norma del error de su estadística.

Y así, simplemente al azar remuestreo de la muestra original con reemplazo, más y más, hemos obtenido una idea de cuán precisa es la estimación, dado que sólo tenemos una muestra de la población.

Por supuesto, si usted puede medir a toda la población, entonces no hay ningún punto en el arranque.

2voto

Bill Puntos 16

He comprendido que el bootstrapping es una técnica utilizada para estimar estadísticas de una población.

Es una técnica que se utiliza principalmente

  • para estimar el error estándar de un estimador de un parámetro de población $\theta$ y/o

  • para derivar los intervalos de confianza para $\theta$

en situaciones en que estas cifras son muy difíciles de obtener por la estadística matemática.

In bootstrapping we take many samples of chosen size, estimate statistics and obtain the mean of these statistics. This mean is representative of the whole population.

De hecho, es una técnica de remuestreo y obras de muestreo $n$ observaciones con la sustitución de la original $n$ observaciones. La clave de la declaración es que tales remuestreada bootstrap ejemplo es la muestra original como el original de la muestra es la población. No la media de la bootstrapped estadística es generalmente de interés, sino más bien la variación, ya que permite encontrar los intervalos de confianza.

My doubt is that why take the samples in the first place. If you have the whole population with you, calculate the statistics on the whole for which you get 100% accurate statistics ?

Normalmente, no tenemos acceso a toda la población. Pero si tenemos, de hecho, generalmente no hay necesidad de hacer cualquier estadística inferencial (incluyendo el bootstrap).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X