¿Cuál es la diferencia entre una población y una muestra? ¿Qué variables comunes y se utilizan las estadísticas para cada uno, y ¿cómo estos se relacionan entre sí?
Respuestas
¿Demasiados anuncios?La población es el conjunto de entidades bajo estudio. Por ejemplo, la estatura media de los hombres. Esta es una población hipotética, ya que incluye todos los hombres que han vivido, vivo y viviré en el futuro. Me gusta este ejemplo, porque se lleva a casa el punto de que nosotros, como analistas, elija la población que queremos estudiar. Normalmente es imposible encuesta/medir a toda la población debido a que no todos los miembros son observables (por ejemplo, los hombres que existirá en el futuro). Si es posible enumerar la totalidad de la población es a menudo costoso para hacerlo, y se necesitaría una gran cantidad de tiempo. En el ejemplo anterior tenemos una población "hombres" y de un parámetro de interés, su altura.
En su lugar, podríamos tomar un subconjunto de esa población llamada muestra y utilizar este ejemplo para extraer inferencias acerca de la población objeto de estudio, teniendo en cuenta algunas condiciones. Así podremos medir la estatura media de los hombres en una muestra de la población a la que llamamos una estadística y el uso de este para sacar conclusiones sobre el parámetro de interés en la población. Es una inferencia, ya que habrá cierta incertidumbre y la imprecisión implicados en la elaboración de conclusiones acerca de la población sobre la base de un ejemplo. Esto debería ser obvio - tenemos menos de los miembros de nuestra muestra de nuestra población, por lo que hemos perdido algo de información.
Hay muchas maneras de seleccionar una muestra y el estudio de esto es la llamada teoría del muestreo. Un método comúnmente utilizado es el denominado Muestreo Aleatorio Simple (SRS). En el SRS cada miembro de la población tiene la misma probabilidad de ser incluido en la muestra, de ahí el término "azar". Hay muchos otros métodos de muestreo por ejemplo, muestreo estratificado, muestreo por conglomerados, etc, todos tienen sus ventajas y desventajas.
Es importante recordar que la muestra sacamos de la población es de sólo uno de un gran número de posibles muestras. Si de diez investigadores fueron todos los que estudian la misma población, dibujando sus propias muestras, a continuación, se pueden obtener diferentes respuestas. Volviendo a nuestro ejemplo anterior, cada uno de los diez investigadores pueden venir con diferentes estatura media de los hombres es decir, la estadística en cuestión (media altura) varía de muestra a muestra tiene una distribución llamada de una distribución de muestreo. Podemos utilizar esta distribución para entender la incertidumbre en la estimación del parámetro de población.
La distribución de muestreo de la media muestral es conocido por ser una distribución normal con una desviación estándar igual a la desviación estándar de la muestra dividido por el tamaño de la muestra. Debido a que este podría ser fácilmente confundida con la desviación estándar de la muestra es más común para llamar la desviación estándar de la distribución de muestreo el error estándar.
La población es el conjunto de valores, o de particulares, usted está interesado en. La muestra es un subconjunto de la población, y es el conjunto de valores que realmente utilice en su estimación.
Así, por ejemplo, si usted quiere saber la estatura promedio de los residentes de China, que es su población, es decir, la población de China. La cosa es que, este es un número bastante grande, y usted no será capaz de obtener los datos para todos los presentes. Para dibujar una muestra, es decir, obtener algunas observaciones, o la altura de algunas de las personas en China (un subconjunto de la población, la muestra) y hacer la inferencia basada en eso.
La población lo es todo en el grupo de estudio. Por ejemplo, si se estudia el precio de las acciones de Apple, es la histórica, actual, e incluso en el futuro todos los precios de las acciones. O, si se ejecuta un huevo de fábrica, es todos los huevos en la fábrica.
No siempre se tiene la muestra y hacer pruebas estadísticas. Si su población es de inmediato a su vida familiar, no necesita de la muestra, como la población es pequeña.
El muestreo es popular para una variedad de razones:
- es más barato que un censo (muestreo de la totalidad de la población)
- usted no tiene acceso a los datos en el futuro, por lo que debe la muestra el pasado
- tienes que destruir algunos de los elementos de prueba de ellos, y no quieren destruir a todos ellos (por ejemplo, huevos)
Cuando pensamos en el término "población", solemos pensar en la gente en nuestra ciudad, región, estado o país y sus respectivas características tales como género, edad, estado civil, pertenencia étnica, religión y así sucesivamente. En estadística, el término "población" tiene un significado ligeramente diferente. La "población" en la estadística incluye a todos los miembros de un grupo definido que estamos estudiando, o la recopilación de información para la toma de decisiones basadas en datos.
Una parte de la población se denomina muestra. Es una proporción de la población, un fragmento, una parte de él y de todas sus características. Un ejemplo es científicamente dibujado grupo que posea las mismas características de la población – si se extraen al azar.(Esto puede ser difícil para usted a creer, pero es verdad!)
Se seleccionó al azar las muestras deben tener dos características:
*Cada persona tiene igual oportunidad de ser seleccionado para la muestra; y,
*Selección de una persona es independiente de la selección de otra persona.
Lo que es genial sobre muestras aleatorias es que se puede generalizar a la población de que usted está interesado en. Así que si usted muestra de 500 familias en su comunidad, usted puede generalizar a las más de 50.000 familias que viven allí. Si usted coincide con algunas de las características demográficas de los 500 con los 50.000, verá que son sorprendentemente similares.