Estoy buscando algunas sugerencias sobre la evaluación de la representatividad de un determinado conjunto de datos que estoy analizando.
En este conjunto de datos estoy buscando en la relación entre dos variables (por ejemplo, X e y) en una población que se divide en cinco bloques diferenciados. El principal problema es que los datos se basan en los informes de la pública, por lo que algunos bloques tienen mucha más información que otros.
El objetivo es evaluar si la relación entre X y y difiere entre los bloques, sino también para determinar el grado de confiabilidad de tales estimaciones, dado que no tenemos realmente una muestra aleatoria de la población general.
Cualquier sugerencia apreciado.
Gracias