6 votos

Definición formal de toma de muestras

Puedo identificar cuando lo veo y puedo escribir un programa que muestra de una distribución, pero me pregunto si hay una forma más rigurosa y formal de definir muestreo muestreo. Algo más que "un proceso de selección de un miembro de una población según alguna distribución". ¿Hay una definición más profunda, o esto es como va?

1voto

Bey Puntos 126

Nota: he encontrado el artículo de la wikipedia sobre el muestreo a ser bastante bueno, con un panorama general informal.


Una cosa a tener en cuenta es que el uso de la palabra la muestra es ambiguo. Por ejemplo, cuando voy a una tienda de helados y pedir una "muestra", que tan bien hace a este acuerdo con la estadística de la noción de muestreo?

Más en serio, si yo soy el análisis de una muestra de conveniencia (es decir, que respondieron a una XBox encuesta), ¿cómo es esto diferente de la anterior ejemplo y de la canónica "muestreo aleatorio simple" todos aprendemos en la Introducción de Datos?

Así, se ha pedido a una pregunta interesante sobre la palabra "muestra" y creo que lo hace ir más profundo. No he encontrado una referencia sólida para la filosofía de muestreo (me encantaría ver una obra de este tipo), pero yo diría que hay una diferencia entre los datos y una muestra. Específicamente, los datos es algo objetivo (cualquier información puede ser de datos), pero un ejemplo es contextual. Usted puede buscar en una lista de números y decir "que es un ejemplo".

Entonces, ¿qué hace de los datos de una muestra? Mi opinión es que un válido ejemplo debe ser datos recopilados con el fin de responder a una o más preguntas estadísticas. No sólo eso, sino que una válida de la muestra debe ser relevante para la pregunta.

Por esta razón, considero que los datos sólo se convierte en un ejemplo de cuando usted tiene contexto. Digamos que me dará una lista de las temperaturas. Es esta una muestra? Es si fueron recogidos por, digamos, un meteorólogo para el propósito de la evaluación de la temperatura media en las proximidades del sensor. Sin embargo, no es necesariamente una muestra para evaluar la probabilidad de que un político va a ganar una elección.

Yo digo "no necesariamente", porque estas temperaturas podría ser una muestra válida para esta pregunta (al menos en principio), por ejemplo, si usted tiene un modelo que relaciona la temperatura con la participación de los votantes.

Así, tal vez podamos destilar la esencia de "sampleness" (totalmente de hecho la palabra...pero es la filosofía, por lo que tenemos que tomar libertades ;-) por el siguiente (tentativo) definición:


Deje $\Omega$ a un y $I$ ser una función definida a través de subconjuntos de a $\Omega$. Además, vamos a $X\subset \Omega$.Decimos que $X$ es un ejemplo para $I$ fib existe $Y \subset \Omega$ tal que $X \neq Y$$I(X) \neq I(Y)$.


Para mí, esta definición es la esencia de una muestra: una muestra debe tener la capacidad de cambiar el resultado de una inferencia, la decisión, la predicción o estimación (todos estos son ejemplos de $I$).

En el caso de la estadística paramétrica, podemos definir a la $I$ a la probabilidad de la función del conjunto de datos $X$. Para nonparametic estadísticas, tendríamos que contar con $I$ ser la función de la prueba de $T(X)$ o de la estimación/predicción.

Por supuesto, en ejemplos del mundo real, ya hemos hecho este filtrado, así que casi siempre tienen muestras válidas. Sería un gran error, de hecho, para crear en no válido ejemplo de un problema (por ejemplo, medir el diámetro de las manzanas para estimar el ancho de la galaxia de Andrómeda).

Sin embargo, en un nivel más filosófico, si asumimos que nuestro mundo es coherente entonces no podemos negar que podrían existir, en principio, un informativo de relación entre dos aparentemente sin relación de objetos. Así que, de nuevo, el concepto de muestra debe ser definida con respecto a una función específica, $I$ para ser precisos.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X