Estoy perplejo por algunas de las líneas verticales que aparecen en estos diagramas de dispersión en una escala logarítmica. La población está en el eje de las y y la proporción de la vecindad con el atributo mencionado en el panel de etiquetas en el eje x. Es sólo un artefacto de la transformación? (Pensé que quizás esto era debido a la preferencia de dígitos o algo así, pero no puedo pensar en cómo esto puede ser posible en este conjunto de datos a partir de los datos del censo.)
Respuestas
¿Demasiados anuncios?Veo que las líneas están siempre a $\log( y ) = a - <log( x )$, por ejemplo, en la parte inferior izquierda del panel, la proporción de $10^{-4}$ corresponde a la población de $10^4$. Creo que la población se utilizó al calcular el valor.
Por ejemplo, tal vez el censo no grabar "¿cuál es la proporción de los Chinos en el barrio", sino más bien "cómo muchos de los Chinos que viven en el barrio". Las respuestas se $1, 2, 3,\ldots$ etc. Y automáticamente, dado el tamaño de la población de $N$, los valores correspondientes serán $\frac{1}{N}$, $\frac{2}{N},\ldots$ etc. Estos se corresponden a la primera inferior izquierda de la línea diagonal, segundo inferior izquierda de la diagonal de la línea y así sucesivamente.
Es debido a los efectos entero con recuentos bajos de la pertenencia a una clase.
Considere la posibilidad de la "No Filipino" el gráfico en la parte inferior izquierda. Nota cómo la parte inferior izquierda de la línea que pasa por el punto (-3,3). Ese punto correspondería a la 1 de la observación de un No Filipino de $10^3$ de personas en el barrio. Tenga en cuenta también que para los Chinos el gráfico, la línea pasa a través de la misma (-3,3), y de la misma manera para los Discapacitados gráfico. Las líneas también ir a través de la (-4,4) punto de observación de $10^4$ de la gente. Si tenemos en cuenta donde una observación de 3.500 personas se encuentran (en (-3.54,3.54)), se puede ver cómo la línea se genera.
La siguiente línea a la derecha pasa a través de puntos que parecen ser de alrededor de 0.3 x-unidades mayor que la primera línea; esta es la línea correspondiente a los dos observaciones de No Filipinos, o Chino, o Deshabilitado (log10(2) = 0.3). Ya no se puede observar entre el 1 y el 2 No los Filipinos, tiene una brecha entre las dos líneas.
Estas cosas pasan, he visto similares a mí mismo.