13 votos

¿Hay alguna razón estadística para líneas diagonales en el diagrama de dispersión en una escala logarítmica?

Estoy perplejo por algunas de las líneas verticales que aparecen en estos diagramas de dispersión en una escala logarítmica. La población está en el eje de las y y la proporción de la vecindad con el atributo mencionado en el panel de etiquetas en el eje x. Es sólo un artefacto de la transformación? (Pensé que quizás esto era debido a la preferencia de dígitos o algo así, pero no puedo pensar en cómo esto puede ser posible en este conjunto de datos a partir de los datos del censo.)

enter image description here

17voto

Gmaster Puntos 21

Veo que las líneas están siempre a $\log( y ) = a - <log( x )$, por ejemplo, en la parte inferior izquierda del panel, la proporción de $10^{-4}$ corresponde a la población de $10^4$. Creo que la población se utilizó al calcular el valor.

Por ejemplo, tal vez el censo no grabar "¿cuál es la proporción de los Chinos en el barrio", sino más bien "cómo muchos de los Chinos que viven en el barrio". Las respuestas se $1, 2, 3,\ldots$ etc. Y automáticamente, dado el tamaño de la población de $N$, los valores correspondientes serán $\frac{1}{N}$, $\frac{2}{N},\ldots$ etc. Estos se corresponden a la primera inferior izquierda de la línea diagonal, segundo inferior izquierda de la diagonal de la línea y así sucesivamente.

16voto

bheklilr Puntos 113

Es debido a los efectos entero con recuentos bajos de la pertenencia a una clase.

Considere la posibilidad de la "No Filipino" el gráfico en la parte inferior izquierda. Nota cómo la parte inferior izquierda de la línea que pasa por el punto (-3,3). Ese punto correspondería a la 1 de la observación de un No Filipino de $10^3$ de personas en el barrio. Tenga en cuenta también que para los Chinos el gráfico, la línea pasa a través de la misma (-3,3), y de la misma manera para los Discapacitados gráfico. Las líneas también ir a través de la (-4,4) punto de observación de $10^4$ de la gente. Si tenemos en cuenta donde una observación de 3.500 personas se encuentran (en (-3.54,3.54)), se puede ver cómo la línea se genera.

La siguiente línea a la derecha pasa a través de puntos que parecen ser de alrededor de 0.3 x-unidades mayor que la primera línea; esta es la línea correspondiente a los dos observaciones de No Filipinos, o Chino, o Deshabilitado (log10(2) = 0.3). Ya no se puede observar entre el 1 y el 2 No los Filipinos, tiene una brecha entre las dos líneas.

Estas cosas pasan, he visto similares a mí mismo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X