32 votos

¿Cuál es el concepto estadístico más difícil de entender?

Esta es una pregunta similar a la que aquí Pero creo que es lo suficientemente diferente como para que valga la pena preguntar.

Pensé en poner como inicio, lo que creo que es uno de los más difíciles de entender.

La mía es la diferencia entre probabilidad y frecuencia . Una se sitúa en el nivel del "conocimiento de la realidad" (probabilidad), mientras que la otra se sitúa en el nivel de la "realidad misma" (frecuencia). Esto casi siempre me confunde si pienso demasiado en ello.

Edwin Jaynes acuñó un término llamado "falacia de proyección mental" para describir la confusión de estas cosas.

¿Algún otro concepto difícil de entender?

0 votos

(No sé lo suficiente como para poner esto como respuesta, de ahí que añada un comentario.) Siempre he pensado que es extraño que PI aparezca en las ecuaciones estadísticas. Es decir, ¿qué tiene que ver PI con la estadística? :)

2 votos

Estoy de acuerdo (en mi sorpresa) - Creo que es que $\pi$ aparece en muchos análisis matemáticos. Sólo una nota que puedes escribir $\pi$ mediante comandos Latex como $\text{\pi}$ encerrados entre signos de $. Utilizo la página de la wiki para obtener la sintaxis es.wikibooks.org/wiki/LaTeX/Matemáticas . Otro truco es hacer "click derecho" en una ecuación que veas en este sitio, y seleccionar "mostrar fuente" para obtener los comandos que se utilizaron.

0 votos

@Wiki Si aceptas que $\pi$ cuando se pasa de medir la longitud de un trozo de línea recta a la longitud de un trozo de círculo, no veo por qué no iba a aparecer al pasar de medir la probabilidad de caerse en un segmento a medir la probabilidad de caerse en un trozo de círculo?

31voto

Akira Puntos 1061

Por alguna razón, la gente tiene dificultades para comprender lo que es realmente un valor p.

3 votos

@shabbychef: La mayoría de la gente lo capta en el lo peor posible, es decir, la probabilidad de cometer un error de tipo I.

2 votos

Creo que eso está relacionado sobre todo con la forma en que se explican los valores p en las clases (es decir, dando una definición rápida y sin especificar lo que NO son los valores p)

0 votos

Creo que esto tiene que ver principalmente con la forma en que se introduce. Para mí, era un "complemento" de la prueba de hipótesis clásica, por lo que parece que es sólo otra forma de hacer una prueba de hipótesis. El otro problema es que normalmente sólo se enseña con respecto a una distribución normal, donde todo "funciona bien" (por ejemplo, el valor p es una medida de prueba en la comprobación de una media normal). La generalización del valor p no es fácil, ya que no hay principios específicos que guíen la generalización (por ejemplo, no hay acuerdo general sobre cómo debe variar un valor p con el tamaño de la muestra y las comparaciones múltiples)

23voto

simmosn Puntos 304

Al igual que la respuesta de shabbychef, es difícil entender el significado de un intervalo de confianza en la estadística frecuentista. Creo que el mayor obstáculo es que un intervalo de confianza no responde a la pregunta que nos gustaría responder. Nos gustaría saber: "¿cuál es la probabilidad de que el valor verdadero esté dentro de este intervalo concreto?". En cambio, sólo podemos responder, "¿cuál es la probabilidad de que un intervalo elegido al azar y creado de esta manera contenga el verdadero parámetro?" Esto último es obviamente menos satisfactorio.

1 votos

Cuanto más pienso en los intervalos de confianza, más difícil me resulta pensar en qué tipo de pregunta pueden responder a nivel conceptual que no se pueda responder preguntando por "la probabilidad de que un valor verdadero esté dentro de un intervalo, dado el estado de conocimiento de uno". Si yo preguntara "¿cuál es la probabilidad (condicionada a mi información) de que la renta media en 2010 estuviera entre 10.000 y 50.000?" No creo que la teoría de los intervalos de confianza pueda dar una respuesta a esta pregunta.

21voto

¿Qué significa "grados de libertad"? ¿Qué pasa con los df que no son números enteros?

13voto

dmk38 Puntos 1066

La probabilidad condicional probablemente lleva a la mayoría errores en la experiencia cotidiana. Hay muchos conceptos más difíciles de captar, por supuesto, pero la gente no suele preocuparse por ellos; de éste no pueden escapar y es una fuente de desventuras desenfrenada.

0 votos

+1; ¿podría añadir uno o dos ejemplos, favoritos o actuales?

1 votos

Para empezar: P(tienes la enfermedad|la prueba es positiva) != P(la prueba es positiva|tienes la enfermedad).

9voto

Creo que muy pocos científicos entienden este punto básico: sólo es posible interpretar los resultados de los análisis estadísticos al pie de la letra, si cada paso fue planificado de antemano. En concreto:

  • El tamaño de la muestra debe elegirse de antemano. No está bien seguir analizando los datos a medida que se añaden más sujetos, deteniéndose cuando los resultados parecen buenos.
  • Los métodos utilizados para normalizar los datos o excluir los valores atípicos también deben decidirse de antemano. No está bien analizar varios subconjuntos de los datos hasta encontrar los resultados que nos gustan.
  • Y finalmente, por supuesto, los métodos estadísticos deben decidirse de antemano. ¿No está bien analizar los datos mediante métodos paramétricos y no paramétricos, y elegir los resultados que te gusten?

Los métodos exploratorios pueden ser útiles para, bueno, explorar. Pero luego no se puede dar la vuelta y hacer pruebas estadísticas normales e interpretar los resultados de la forma habitual.

5 votos

Creo que John Tukey podría estar en desacuerdo es.wikipedia.org/wiki/Análisis_de_datos_exploratorios ;o)

3 votos

En este sentido, discrepo parcialmente. Creo que la advertencia que la gente pasa por alto es que las operaciones de acondicionamiento adecuadas son fáciles de ignorar para este tipo de cuestiones. Cada una de estas operaciones cambia las condiciones de la inferencia, y por lo tanto, cambian las condiciones de su aplicabilidad (y por lo tanto a su generalidad). En definitiva, sólo son aplicables al "análisis confirmatorio", en el que se ha construido un modelo y una pregunta bien definidos. En la fase exploratoria, no se busca responder a preguntas definidas, sino construir un modelo y formular hipótesis para los datos.

0 votos

He editado un poco mi respuesta para tener en cuenta los comentarios de Dikran y probabilityislogic. Gracias.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X