Hay un gráfico bastante chulo que me gustaría recrear sólo con fines ilustrativos. No hay inferencias vitales que estén en juego, así que no pasa nada por emborronar un poco las cifras. Básicamente, sólo quiero captar las características generales de los datos y presentarlos de forma muy similar. Aquí está la referencia:
Pregunta: ¿Puede alguien proporcionar algún pseudocódigo o código python para crear un gráfico bastante similar al anterior? Parece que la media está en torno a 10^8, pero la dispersión es muy complicada (al menos para mí). La otra parte complicada es reproducir esa gran concentración de puntos de datos que se encuentran bajo la línea diagonal. Ten en cuenta que la dispersión no es simétrica respecto a la línea diagonal.
Otras aclaraciones
- Observaciones: 500 (probablemente un conjunto de datos menor que el original, no necesito 1.000 millones de puntos)
- Escala: log
- Componentes opcionales: la línea diagonal, las etiquetas y las elipses de grupo son opcionales, puede omitirlas si lo desea.