Considere la posibilidad de voltear a sus preguntas alrededor.
Comenzar con la no correlación de datos generadas por este tipo de datos al azar, por lo que estas variables son independientes; mi y es normal y mi x es log(1+X1) donde X1 es una mezcla de varias distribuciones geométricas elegido para dar una más o menos similar en apariencia a su parcela:
El eje de la variable es simétrica y la x de la variable es ligeramente sesgado, pero fundamentalmente, ninguna de estas variables es muy larga cola.
Usted, a continuación, obtener muchos casos relativamente grandes valores de X y y juntos, porque la probabilidad de que, o bien está por encima de su rango medio (el centro de la trama) es alta, por lo que la probabilidad de que ambos serán también es razonablemente alto (por ejemplo, en algún lugar alrededor de 0.15-0.25), el producto en este caso de 0,5 para el eje de la variable y algo un poco menos de 0,5 para el x-variable.
¿Qué sucede si usted exponentiate dos variables, que son simplemente independiente, bajito-cola variables:
Se puede conseguir algo muy similar a su primera parcela. Esto hace que ambas variables - aunque todavía independientes - fuertemente derecho skew (larga cola a la derecha), ... y que es donde la apariencia viene.
¿Por qué aspecto tiene forma de "L"? Simplemente debido a que los altos valores de las variables X e y son relativamente raras, y la combinación de los dos (debido a su independencia) aún más raros. Porque para cada variable, casi todos los demás de la variable valores están muy por debajo de sus medios, a un extremo de X o Y es probable que esté asociado con los valores de la otra variable de abajo/izquierda de la media de la parcela.
por ejemplo, si el 5% de cada distribución está por encima de la gama media, luego de alrededor de 0,25% de los valores (es decir, no se muy bien 1 en promedio) estará en el cuadrante superior derecho.
Que ver casi el mismo fenómeno con cualquiera de los dos lo suficientemente derecho desfase variables que son independientes, y en muchos de los que están cerca de independiente. Aquí son dos variables aleatorias independientes (los valores absolutos de t-distribuido variables aleatorias con 1.5 d.f. y escalas diferentes):