4 votos

¿Por qué la invariancia de escala puede causar una pérdida de poder explicativo?

Gary King hizo el siguiente declaración en Twitter :

La invariancia de escala suena bien pero es los estadísticos suelen eludir la la responsabilidad y la pérdida de poder al descuidando la información sobre el tema

¿Cuál es un ejemplo de este fenómeno, en el que invarianza de escala ¿causa una pérdida de potencia?

Editar:

Gary respondió :

no la potencia [estadística], sino la invariabilidad de la escala pierde el poder que se puede extraer del conocimiento de la sustancia

Ahora esto tiene más sentido. ¿Cómo puede la invarianza de escala causar una pérdida de poder explicativo del análisis resultante?

4voto

jldugger Puntos 7490

Me sigue pareciendo negativo lo que parece un insulto gratuito por parte de King, pero entiendo de dónde puede venir. La "invariabilidad de escala" es una restricción de un procedimiento estadístico. Por lo tanto, limitar nuestra elección de procedimientos a los invariantes de escala (o a los lineales o a los insesgados o a los minimax, etc.) excluye potencialmente procedimientos que podrían funcionar mejor. Depende de si esto es realmente así o no. En muchas situaciones, los datos se presentan en unidades que son esencialmente independientes de lo que se está estudiando. No debería importar si se miden las distancias en angstroms o en parsecs, por ejemplo. En este contexto, cualquier procedimiento que se no invariante de escala es, por tanto, un arbitrario y la arbitrariedad no es un atributo positivo en este campo. En otras situaciones, sin embargo, existe una escala natural. La más obvia es la relativa a los datos contados. Un procedimiento que trata los datos contados como si fueran mediciones en una escala continua (por ejemplo, utilizando OLS para una respuesta contada) es potencialmente inferior a otros procedimientos disponibles y puede ser (probablemente es, sospecho) inadmisible en el sentido de la teoría de la decisión. Este puede ser un punto delicado y sutil porque no siempre es obvio cuando tenemos datos contados. Un ejemplo con el que estoy familiarizado se refiere a muchas mediciones químicas o de radiactividad, que en última instancia se originan como recuentos en alguna máquina. Dichos recuentos son convertidos por el laboratorio en una concentración o actividad que, para siempre, se trata como un número real. (Sin embargo, los intentos de explotar este hecho en la literatura quimiométrica no han dado lugar a procedimientos estadísticos superiores).

Sólo para evitar un posible malentendido: Yo no vería la selección de una prioridad informativa para un parámetro de escala (en un análisis bayesiano) como un procedimiento dependiente de la escala. Tal prioridad obviamente favorece algunos rangos de valores sobre otros, pero no afecta a la invariabilidad de la escala del procedimiento en sí.

3voto

alexp206 Puntos 899

Tenemos la tendencia a machacar los datos según algoritmos y métodos preestablecidos, y olvidamos que los "datos" son en realidad información sobre el mundo real. Recuerdo que, cuando era niño, resolvía una ecuación de segundo grado en la que el profesor había dicho que la respuesta representaba la longitud de un lápiz. Algunos estudiantes dijeron que la respuesta era "una pulgada más o menos dos pulgadas".

Antes de introducir sus datos en cualquier software, debería llegar a realmente conocerla y comprenderla, lo que sólo puedes lograr si tienes presente el tema. Sólo así podrás detectar puntos de datos extraños (como un lápiz que mide -1 pulgada) o determinar qué escalas tienen sentido en el mundo real.

1voto

Permítanme hacer una apuesta en esto...

Si entiendo el sentimiento original y la respuesta posterior, creo que lo que Gary King quiere decir es que notar un efecto de invariancia de escala en tus datos es una comprensión muy burda del fenómeno de lo que está pasando. Si bien esta "vista de pájaro" de cualquier fenómeno que se observe podría ser reveladora, uno podría pasar por alto información útil a nivel microscópico.

Puede que este ejemplo no sea el mejor, pero considere el "Juego de la Vida" de Conway. Esto está completamente determinado, como en un sistema determinista. Considere la posibilidad de observar alguna estadística de este sistema, la longevidad de los racimos, digamos, para alguna definición apropiada de racimo. Para argumentar, digamos que esto sigue una ley de potencia (no sé si lo hace o no, pero sólo para este ejemplo, digamos que lo hace). Esto da una descripción de alto nivel del sistema pero has lavado todos los detalles de cómo los planeadores corren a través del tablero, cómo colisionan para dar armas de planeadores y otra información útil que podrías usar para determinar algunos detalles específicos de tu sistema.

No estoy seguro de que este sea el mejor ejemplo o incluso de que haya captado la esencia de lo que Gary King estaba tratando de decir, pero esos son mis dos centavos.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X