53 votos

Términos estadísticos más confusos

Los estadísticos utilizamos muchas palabras de forma ligeramente diferente a como las utilizan los demás. Esto causa muchos problemas cuando enseñamos o explicamos lo que hacemos. Empezaré una lista (y ahora añadiré algunas definiciones, por comentarios):

  • La potencia es la probabilidad de rechazar correctamente una hipótesis nula falsa en una situación hipotética en la que los datos provienen de una hipótesis alternativa específica o de un rango de alternativas. Por lo general, esto significa que "nuestro método estadístico debería tener éxito" si "ocurre algo".
  • Sesgo: una estadística está sesgada si es sistemáticamente diferente del parámetro poblacional asociado a ella.
  • Significación: los resultados son estadísticamente significativos en algún porcentaje (a menudo el 5%) en la siguiente situación: Si la población de la que procede la muestra tiene un efecto verdadero de 0, una estadística al menos tan extrema como la obtenida a partir de la muestra sólo se produciría el 5% de las veces.
  • Interacción - Dos variables independientes interactúan si la relación entre la variable dependiente y una variable independiente es diferente a distintos niveles de la otra variable independiente

¡Pero tiene que haber muchos más!

23voto

Brettski Puntos 5485

"Significant" es el más grande con el que me encuentro, porque tiene tanto un significado de uso común en inglés y que el significado aparecerá en la discusión de los resultados de la investigación. Incluso me encuentro mezclando "significativo" para significar importante en la misma frase en la que he hablado de resultados estadísticos.

Por ahí va la locura.

20voto

Dilip Sarwate Puntos 16161

Sugiero que se añada Linear a la lista.

Le pregunté a un pregunta en math.SE sobre lo que yo, como ingeniero, considero lineal estimación del error cuadrático medio mínimo de una variable aleatoria $Y$ dado el valor de una variable aleatoria $X$ (lo que significa estimar $Y$ como $\hat{Y} = aX+b$ con $a$ y $b$ siendo elegidos de forma que minimizar $E[(Y-aX-b)^2]$ ), y dio una respuesta parcial. Uno de los los comentarios de la pregunta decía

"Me siento algo incómodo con su lenguaje, ya que temo que esta forma de utilizar la palabra "lineal" pueda alimentar el malentendido popular de que la razón por la que la regresión lineal se llama regresión lineal es que uno está ajustando una línea. La gente que piensa así se confunde cuando un estadístico insiste en que se está haciendo una regresión lineal cuando se ajusta una parábola o una onda sinusoidal, etc."

Entonces, ¿qué hace ¿la regresión lineal significa para un estadístico?

15voto

guest Puntos 1851

"Confianza"

Es muy difícil disuadir a los no estadísticos de que su confianza intervalo no es (directamente) una afirmación sobre el credibilidad de diferentes valores de los parámetros.

Para tener confianza, en el sentido técnico del término, tenemos que imaginar un conjunto de experimentos repetidos, cada uno de los cuales calcula un intervalo de alguna manera preestablecida. Para que sea un intervalo de confianza del 95%, el 95% de estos usos de la fórmula atraparán el parámetro de interés pertinente.

Pero los no estadísticos interpretan habitualmente que el "95% de confianza" es una afirmación sobre los valores plausibles de los parámetros, basada en un solo experimento. Normalmente, asumen que el intervalo cubre el 95% de algunas creencias posteriores sobre el parámetro, es decir, "estamos bastante seguros de que el parámetro está entre $a$ y $b$ ". En su lugar, esto define un creíble intervalo.

(Por supuesto, hay situaciones en las que las dos nociones coinciden, ya sea de forma aproximada o exacta. Pero en general no lo hacen, y la concordancia numérica no elimina el problema del mal uso de los términos técnicos).

14voto

John Richardson Puntos 1197

Probabilidad

Me parece que la mayoría de los problemas relacionados con la interpretación de las pruebas de hipótesis y los intervalos de confianza se derivan de la aplicación de una definición bayesiana de "probabilidad" cuando el procedimiento se basa en una frecuentista. Por ejemplo, el valor p es la probabilidad de que la hipótesis nula sea cierta, cuando AFAICS no puede asociarse ninguna probabilidad a la verdad de una hipótesis concreta en un entorno frecuentista.

11voto

Mats Fredriksson Puntos 7136

"Probabilidad": es sinónimo de "probabilidad" en el lenguaje cotidiano, pero en Estadística tiene un significado especial: es una función de los parámetros de un modelo estadístico y una situación de datos particular, cuyo valor es la probabilidad del resultado observado suponiendo que los parámetros son iguales a los valores de los parámetros.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X