2 votos

Cuantificación de la heterogeneidad

He tratado de cuantificar la heterogeneidad de una determinada variable. Me gustaría decir que la distribución en las concentraciones de calcita, por ejemplo, es más heterogénea en una formación rocosa que en otra.

Hasta ahora he graficado y comparado las distribuciones de las variables con histogramas superpuestos y diagramas de caja para múltiples variables, y en general esto está bien, pero toma tiempo de parte del lector interpretar los diagramas. He estado buscando comparaciones más directas, por ejemplo, gráficos de barras que comparen una medida apropiada de la variabilidad de la muestra en una formación, por ejemplo, la desviación estándar, el rango intercuartil, el coeficiente de variación, la desviación absoluta media o la mediana, etc. Pero por diversas razones no estoy satisfecho con estos enfoques.

No puedo evitar pensar que debe haber una forma más ordenada y sucinta de cuantificar la heterogeneidad/variabilidad

Responder a los comentarios:

Estoy investigando el error residual entre algunos valores predichos y observados. Los errores residuales para la roca A están distribuidos de forma ajustada y para la roca B están ampliamente distribuidos de forma no normal.

Estoy tratando de relacionar la variabilidad observada en el error, con la variabilidad observada en otras propiedades de la roca. Ambas rocas A y B son variables en diferentes aspectos, y estoy tratando de destacar la variabilidad que podría importar.

Así que he estado buscando formas de caracterizar la variabilidad con un solo valor, digamos que trazando todos los IQR de cada variable uno al lado del otro en un gráfico de barras, por ejemplo, donde uno podría inferir que la roca A es generalmente más variable que la roca B.

Mis problemas son los siguientes: las variables como la porosidad suelen estar siempre distribuidas de forma normal y ajustada. En cambio, la permeabilidad siempre es no normal, está muy sesgada, varía en 6 o 7 órdenes de magnitud y suele seguir una tendencia de potencia. En el caso de la permeabilidad, no estoy seguro de que un IQR capte realmente la variabilidad y, en segundo lugar, los IQR de las distintas variables no se representan bien entre sí, dada la diferencia de magnitud de la unidad principal. He mirado las medidas normalizadas de variabilidad, pero éstas falsean los valores con medias o medianas que no creo que reflejen los datos.

Tal vez no exista una solución ideal para estilos de distribución tan variados y deba limitarse a presentar sus distribuciones .?

2voto

Nick Cox Puntos 22819

La porosidad, tal y como yo la entiendo, es la fracción de volumen que son huecos, por lo que está estrictamente limitada por 0 y 1 (0 y 100%), y en la práctica puede acercarse a 0 pero raramente se acerca a 1.

Describes bien las propiedades de la permeabilidad según entiendo.

Como principio general, yo diría que primero hay que elegir una escala en la que las distribuciones sean aproximadamente simétricas. (Aproximadamente gaussiana o normal es un ideal estadístico, pero menos importante en detalle. Gaussiano implica simetría, pero lo contrario no es cierto). Si puedes hacer eso, todo será mucho más claro.

Yo esperaría dejar los valores de porosidad como están.

Yo esperaría tener que mirar la permeabilidad en una escala de registro o incluso recíproca. (Una escala recíproca tiene la sencilla pero útil propiedad de que las unidades también se invierten). Eso es cierto para todo lo que varía en varios órdenes de magnitud.

Si lo hace, a menudo encontrará que los tipos habituales de medidas de variabilidad marchan juntos, por ejemplo la IQR y la SD serán aproximadamente proporcionales, y así sucesivamente.

Es posible que aún tenga que preocuparse por la sensibilidad de sus medidas de variabilidad a los valores atípicos o a las colas muy estiradas.

Con una buena elección de la escala, cualquier heteroscedasticidad aparente -un asunto relacionado pero no idéntico- también suele ser domada en cierta medida.

Si puede acceder a una copia, Hoaglin, D.C., Mosteller, F. y Tukey, J.W. (Eds). 1983. Comprender el análisis de datos robusto y exploratorio. Nueva York: John Wiley, sigue siendo una de las mejores guías en este ámbito. Este libro me ha servido de inspiración a lo largo de los 30 años que lo conozco, y merece la pena releerlo de vez en cuando.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X