4 votos

¿Sigue siendo una muestra aleatoria?

La situación es un poco compleja.
Nuestro objetivo es estudiar algunas propiedades del suelo en una zona amplia.
Según las diferentes condiciones climáticas, esta zona puede dividirse en varias subregiones.
Y cada subregión está compuesta por varios condados.
Ahora, el problema es que en lugar de elegir algunos condados de cada subregión al azar, elegimos aquellos "típicos" o "representativos" según la opinión de algunos expertos.
A continuación, se recogen muestras de suelo de forma aleatoria en cada condado seleccionado.

¿Sigue siendo una muestra aleatoria? Si no es así, ¿a qué tipo de método de muestreo debería pertenecer, al muestreo de casos típicos o al muestreo de expertos?
¿Podrían estas muestras representar toda la zona? ¿Sigue siendo posible hacer inferencias estadísticas de las muestras a la población?

¿Podría alguien dar alguna opinión al respecto?

2 votos

Aunque no se trata de una investigación social, podría beneficiarse de la literatura sobre metodología de encuestas. Busca en Google "muestreo de encuestas" En la página web de la Comisión Europea, debería encontrar múltiples libros y enlaces sobre diferentes esquemas de muestreo para obtener diseños de muestreo representativos. Ver: stats.stackexchange.com/questions/30715/ y stats.stackexchange.com/questions/11018/ para obtener recursos adicionales.

0 votos

Los tiempos en su pregunta son ambiguos. ¿En qué fase se encuentra exactamente el estudio en este momento: trabajo de campo finalizado; condados seleccionados, pero sin trabajo de campo realizado; o algo más?

0 votos

@SteveSamuels Por ahora, trabajo de campo completado.

1voto

Mike Barrett Puntos 57

Esta muestra de condados estaba "estratificada" por regiones, pero la selección de condados fue no al azar. El nombre de este tipo de muestra es "intencionada".

Lohr (1999, p 463) hace la siguiente valoración de las muestras intencionadas, basándose en un ejemplo comentado por Jerzy Neyman (1934). El artículo de Neyman es quizás el documento fundacional de la teoría del muestreo de encuestas.

Aquí está la cita de su libro:

El artículo de Neyman acabó con la idea de que los resultados de de las muestras intencionales podían generalizarse a la población. Él presentó un ejemplo de la muestra intencional tomada por Gini y Galvani a finales de la década de 1920. Gini y Galvani eligieron 29 distritos que dieron los de los 214 distritos del censo italiano de 1921, en una docena de variables. variables. Pero Neyman demostró que todas las estadísticas distintas de los los valores medios de los controles mostraban un violento contraste entre la muestra y el conjunto de la población.

En su caso, supongo que los expertos tenían algún criterio en el que basaron su selección. ¿Puede describirlos y cómo definieron "típico"? Al igual que Neyman, si se dispone de información externa sobre los mismos criterios para todos los condados, se puede comparar la distribución de la muestra intencionada y de toda la población.

La pena es que se podría haber creado una muestra aleatoria válida basada en los criterios que utilizaron los expertos. Probablemente habría implicado estratificar según sus criterios en la selección de condados y de zonas dentro de los condados. Tille (2006) analiza algunos algoritmos de muestreo avanzados que pueden equilibrar una muestra en función de múltiples criterios. (Estos se implementan en R .) Pero podría haber creado una muestra aleatoria válida de condados incluso sin utilizar los métodos de Tille.

Referencias

Sharon Lohr, 1999, Muestreo. Diseño y análisis, Duxbury.

Jerzy Neyman, 1934. Sobre los dos métodos diferentes del método representativo: El método de muestreo estratificado y el método de selección intencional. J. Royal Statistical Society 197: 558-60

Tillé, Yves. 2006. Algoritmos de muestreo. Nueva York: Springer.

0 votos

Gracias por su respuesta. Los condados "típicos" se eligieron de esta manera: En primer lugar, se identificaron las principales formas del terreno, los tipos de suelo y las prácticas de uso de la tierra en cada subregión. A continuación, se seleccionaron los condados con las principales formas del terreno, tipos de suelo y prácticas de uso de la tierra. De los condados seleccionados, se eligieron algunos como "típicos", basándose en los conocimientos de los expertos, para representar a toda la subregión.

0 votos

El proceso hasta la selección fue ejemplar. El problema es cómo definieron los expertos lo "típico"; ¿describieron el algoritmo por el que hicieron sus selecciones? Según mi experiencia (y la de Neyman), esas selecciones presentan una distribución muy diferente de la real.

0 votos

Le sugiero encarecidamente que compare la muestra seleccionada con lo que se sabe de toda la población y que informe de las diferencias. Tal vez pueda utilizar esta información para estratificar posteriormente los resultados con el fin de representar mejor a la población. Esto podría reducir el sesgo, aunque los errores estándar seguirán siendo problemáticos, ya que suponen un muestreo aleatorio.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X