11 votos

¿Tiene sentido calcular los intervalos de confianza y comprobar las hipótesis cuando se dispone de datos de toda la población?

¿Tiene sentido calcular los intervalos de confianza y comprobar las hipótesis cuando se dispone de datos de toda la población? En mi opinión, la respuesta es no, ya que podemos calcular con precisión los verdaderos valores de los parámetros. Pero entonces, ¿cuál es la proporción máxima de datos de la población original que nos permite utilizar las técnicas mencionadas?

10voto

Zizzencs Puntos 1358

La primera pregunta no tiene una respuesta generalmente aceptada. Mi opinión es como la suya, pero otros han argumentado que una población puede considerarse una muestra de una "superpoblación", aunque la naturaleza exacta de una superpoblación varía según el contexto: Por ejemplo, un censo de todas las personas que viven en un edificio podría considerarse como una muestra de todas las personas que viven en edificios similares; un censo de la población de EE.UU. (que nunca podría ser realmente completo) podría considerarse como una muestra de una superpoblación de estadounidenses que podría existir algún día (o algo parecido). Creo que esto suele ser una excusa para llegar a utilizar los valores p; muchos científicos en campos sustantivos no se sienten cómodos si no tienen un valor p. (Pero eso es mi vista).

La segunda pregunta parece un poco impar para responder de forma general. ¿Cuándo se obtiene una muestra que es (digamos) incluso más de la mitad de la población?

Un problema mayor será la parcialidad. Volviendo al censo de EE.UU., el problema no es simplemente que se pierda gente, sino que las personas que se pierden no son una muestra aleatoria de la población total; por lo tanto, incluso si el censo obtiene respuestas de (para elegir un número) el 95% de todas las personas, si ese 5% restante es muy diferente, entonces los resultados estarán sesgados.

7voto

jasonmray Puntos 1303

Supongamos que sólo 2 de los 12 miembros del comité son mujeres.

La proporción $\frac{1}{6}$ puede tomarse como una estadística descriptiva de toda la población (el comité). Quizá haya que hacer algo para corregir el desequilibrio, independientemente de cómo se haya producido.

O puede tomarse como una estimación de la probabilidad de que una mujer sea seleccionada para el comité, una propiedad del proceso de selección. Se pueden establecer intervalos de confianza, comprobar si es significativamente diferente de la mitad (u otra hipótesis nula relevante), etc. Quizá haya que cambiar el proceso para que sea justo.

Los dos puntos de vista, el descriptivo y el inferencial, no son contradictorios, sino bastante distintos.

La respuesta a la segunda pregunta es que tiene sentido calcular los intervalos de confianza y probar las hipótesis sobre un parámetro de la población incluso si sólo hay un individuo sin muestrear. Sólo hay que tener en cuenta que los IC y las pruebas tienen que tener en cuenta una proporción considerable de la población muestreada: véase corrección de la población finita .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X