5 votos

Explicación de la consistencia de los estimadores a un público no estadístico

¿Cómo demostrarías a un público no estadístico (pictóricamente) que la consistencia de un estimador es importante?

La idea es la siguiente. He demostrado que un estimador multivariante que la gente está interesada en utilizar es inconsistente. Desgraciadamente, este argumento no es lo suficientemente bueno, ya que la comunidad se compone principalmente de médicos y profesionales de la salud que pueden no estar bien versados en este concepto.

¿Alguna sugerencia sobre exposiciones gráficas que la gente haya encontrado útiles para hacer entender este punto?

5voto

AdamSane Puntos 1825

Se trata de un enfoque indirecto que puede ayudarle a considerar la cuestión desde una perspectiva diferente.

Déjame hacer de abogado del diablo por un momento.

En la práctica*, ¿cuánto hace ¿Importa la coherencia?

* (podría pensar si a su público lego le interesa algo más)

Cuando se tienen datos, se tienen algunas particular tamaño de la muestra, $n=n_0$ . Ciertamente, te importa el comportamiento en ese tamaño de muestra. Si está considerando varios tamaños de muestra posibles, el comportamiento en esos varios tamaños de muestra sería importante.

Es probable que nunca vea un tamaño de muestra de un billón. Pero, ¿es realmente relevante la consistencia incluso en un tamaño de muestra específico de orden mucho mayor, como $n=10^{120}$ ? No me dice nada sobre el comportamiento en mi tamaño de muestra real.

¿Por qué el comportamiento en el límite de una secuencia de tamaños de muestra que nunca verás ¿tiene alguna importancia? Ciertamente hay momentos en los que puede ser conveniente en algún sentido, o agradable de tener, pero eso por sí solo no es un gran argumento para que sea realmente importante .

Si puede responder a esa pregunta, podría ver la manera de motivar a un público no especializado.

Si tiene dificultades con esa pregunta, explicarla a un público no especializado no es su primer problema (su primer problema sería más bien ¿por qué es importante para ti? ).

4voto

Peter Carrero Puntos 382

Cree un ejemplo sencillo pero realista, con una "característica de la población" conocida (es decir, un parámetro). Simule a partir de este ejemplo, y cree un gráfico, con el número de observaciones en el x -y las estimaciones de los parámetros "acumulativos" en el eje y -eje. Marque el parámetro de la población con una línea horizontal roja. Señala que las estimaciones convergen¹, pero a un valor completamente diferente del valor "real" (es decir, el parámetro), aunque el número de observaciones sea de millones.

¹ Si el estimador no converge, simplemente señale esto. También puede ser útil mostrar varias realizaciones, para que quede claro.

3voto

Jeff Bauer Puntos 236

Razones para ser coherente, Parte III :

1) Defensa Sonriendo, una propiedad del estimador es "asintótica" cuando no tenemos ni idea de cuándo empezará a afectar visiblemente al comportamiento y los resultados de un estimador. Puede hacer falta una muestra de tamaño inmenso, puede hacer falta unas decenas de observaciones. Así que queremos tener consistencia para evitar que nos lleven al cenicero, y sin siquiera saberlo. Dado que la salud de los pacientes está en juego, supongo que sólo esto debería ser un argumento que los profesionales de la salud escucharan.

Una exposición gráfica podría poseer dos valores, el valor verdadero (y el tratamiento asociado del paciente), y el límite de probabilidad del estimador (valor erróneo), y su tratamiento asociado. Si el tratamiento en el segundo caso es diferente (y posiblemente irrelevante/perjudicial) que el de la consistencia, entonces se tiene el peligro potencial que los usuarios soportarán (e impondrán al paciente) al utilizar el estimador inconsistente.

2) En la mayoría de los casos, la incoherencia también significa la existencia de un sesgo aunque se reúnan grandes cantidades de información (aunque, en sentido estricto, el concepto de (in)sesgo en una situación límite tiene más de una definición). Así que se podría recurrir a algo como "aunque el tamaño de las muestras sea pequeño y no se crea que la inconsistencia importa, al acumularse las mediciones, si se agrupan, su media también será errónea" -ya que la operación de promediación es algo que todo el mundo se siente familiarizado. Así que la incoherencia hace que la puesta en común de las estimaciones obtenidas, o de los datos propiamente dichos, sea engañosa algo que sabotea cualquier intento a medio/largo plazo de descubrir la verdadera situación.

Razones para ser útil, Parte III :
¿Puede darles un resultado positivo? ¿Existe un estimador alternativo que realice el mismo trabajo y que también sea consistente? Y si es así, ¿cómo se compara en cuanto a las propiedades de la muestra fina, como el sesgo, la varianza, el error cuadrático medio?

Razones para preocuparse, Parte III : La situación realmente difícil sería si a) no hay alternativa o b) la alternativa es consistente pero se comporta peor en propiedades de muestras finitas. Aquí se entra en la Teoría del Riesgo y de la Decisión propiamente dicha, en cuyo caso, @whuber debería intervenir y despejar la niebla.

2voto

OpenAndroid Puntos 116

Muchas gracias por sus respuestas.

Mucha gente de esta disciplina me ha preguntado: "¿A quién le importa lo que ocurra en el infinito? Nunca vamos a llegar allí" similar a lo que publicó Glen y mi respuesta ha sido "¿Por qué no consideras la primera entrada de tu muestra como la media de la muestra?" aunque esto parece una respuesta bastante indirecta a la pregunta.

Como respuesta parcial a Glen, la gente en el campo de la medicina utiliza ampliamente el bootstrap que depende críticamente de la consistencia. La respuesta de Alecos da en el clavo en algunas otras cuestiones.

Mi respuesta está en la parte (b) motivo de preocupación de la respuesta de Alecos. La respuesta obtenida actualmente es algo que mucha gente quiere creer, por lo que una alternativa puede no ser bien recibida.

Defender la consistencia resulta muy difícil en un conjunto de datos prácticos. Creía que podía confiar en los fantásticos textos sobre teoría de la decisión, pero todos ellos parecen hacer pasar la inconsistencia por un inconveniente más que por un problema del que hay que librarse.

Para ser más concretos, la mayoría de los textos de Estadística Teórica se abstienen de hacer afirmaciones del tipo "Los estimadores inconsistentes son malos...", a diferencia de los textos de ML que afirman rotundamente que "El sobreajuste es malo...". ¿Puede alguien explicar por qué es así?

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X