Tomemos como ejemplo el conocido vivienda de Boston conjunto de datos. En el artículo original, el modelo de regresión se utiliza para modelar la cantidad de personas que estaban dispuestos a pagar por una mejor calidad del aire.
Pero la 'gente', cuyo comportamiento estaba siendo modelada nunca fue especificado. Es de suponer que no se limita a los residentes de la ciudad de Boston'. Sólo inverosímil sería 'los seres humanos en cualquier lugar del planeta'. Ni, 'todos los residentes de estados unidos'.
Entonces, ¿qué inferencia se nos invita por los autores para dibujar sobre el alcance que la intención de su teoría? Tal vez "todos los habitantes de las grandes áreas metropolitanas estadounidenses'. Pero ¿que sucede con los otros del Primer Mundo las áreas metropolitanas? Las dos primeras secciones de la Boston papel escrupulosamente evitar cualquier referencia que podría sugerir que tenían un particular 'población' de sus 'muestra' se aplica.
También existe la dimensión del tiempo - los datos de los años 70, mientras que en la teoría es no tiene limitaciones de tiempo definidas.
Plus - de volver a los primeros principios -, ¿cómo podría el Boston de los datos se tratan como una muestra de una población, incluyendo a, digamos, la de Chicago área metropolitana cuando no hay datos desde el área de Chicago fue considerado?
Además, muchas de las covariables en el Boston de regresión no muestras a todos, pero los totales - así, por ejemplo, la proporción de negros fue suministrado a partir del censo de estadísticas.
Mi pregunta: ¿cómo podemos concebir el Boston de datos como apoyo a la geográficamente ilimitado de propuestas en el documento? Es allí una manera matemática de mostrar la equivalencia o la aproximación de la Boston análisis de datos a otras ciudades? O sólo es asumido como una cuestión de sentido común - que los autores del libro sería sorprendido al pensar que alguien podría tener alguna duda sobre el tema?