68 votos

¿Cuál es la diferencia entre estimación y predicción?

Por ejemplo, tengo datos históricos de pérdidas y estoy calculando cuantiles extremos (Valor en Riesgo o Pérdida Máxima Probable). ¿Los resultados obtenidos son para estimar las pérdidas o predecirlas? ¿Dónde se puede trazar la línea? Estoy confundido.

4 votos

Estrechamente relacionada está una discusión sobre la diferencia entre intervalos de confianza e intervalos de predicción en stats.stackexchange.com/questions/16493.

99voto

jldugger Puntos 7490

"Predicción" y "estimación" a veces se utilizan indistintamente en la escritura no técnica y parecen funcionar de manera similar, pero hay una distinción clara entre ellos en el modelo estándar de un problema estadístico. Un estimador utiliza datos para intentar adivinar un parámetro mientras que un predictor utiliza los datos para intentar adivinar algún valor aleatorio que no es parte del conjunto de datos. Para aquellos que no están familiarizados con lo que significan "parámetro" y "valor aleatorio" en estadística, lo siguiente proporciona una explicación detallada.

En este modelo estándar, se asume que los datos constituyen una observación (posiblemente multivariada) $\mathbf{x}$ de una variable aleatoria $X$ cuya distribución se conoce solo que se encuentra dentro de un conjunto definido de posibles distribuciones, los "estados de la naturaleza". Un estimador $t$ es un procedimiento matemático que asigna a cada posible valor de $\mathbf{x}$ alguna propiedad $t(\mathbf{x})$ de un estado de la naturaleza $\theta$, como su media $\mu(\theta)$. Así que una estimación es una conjetura sobre el verdadero estado de la naturaleza. Podemos determinar qué tan buena es una estimación comparando $t(\mathbf{x})$ con $\mu(\theta)$.

Un predictor $p(\mathbf{x})$ se refiere a la observación independiente de otra variable aleatoria $Z$ cuya distribución está relacionada con el verdadero estado de la naturaleza. Una predicción es una conjetura sobre otro valor aleatorio. Podemos determinar qué tan buena es una predicción particular solo comparando $p(\mathbf{x})$ con el valor realizado por $Z$. Esperamos que, en promedio, el acuerdo sea bueno (en el sentido de promediar sobre todos los posibles resultados $\mathbf{x}$ y simultáneamente sobre todos los posibles valores de $Z$).

La regresión lineal ordinaria proporciona el ejemplo estándar. Los datos consisten en pares $(x_i, y_i)$ que asocian los valores $y_i$ de la variable dependiente a los valores $x_i$ de la variable independiente. El estado de la naturaleza está especificado por tres parámetros $\alpha$, $\beta$ y $\sigma: dice que cada $y_i$ es como una extracción independiente de una distribución normal con media $\alpha + \beta x_i$ y desviación estándar $\sigma$. $\alpha$, $\beta$ y $\sigma$ son parámetros (números) que se cree que son fijos e invariables. El interés se centra en $\alpha$ (la intersección) y $\beta$ (la pendiente). La estimación de OLS, escrita $(\hat{\alpha}, \hat{\beta})$, es buena en el sentido de que $\hat{\alpha}$ tiende a estar cerca de $\alpha$ y $\hat{\beta}$ tiende a estar cerca de $\beta$, sin importar cuáles sean los valores verdaderos (pero desconocidos) de $\alpha$ y $\beta.

La predicción de OLS consiste en observar un nuevo valor $Z = Y(x)$ de la variable dependiente asociado con algún valor $x$ de la variable independiente. $x$ puede o no estar entre los $x_i$ en el conjunto de datos; eso es inmaterial. Una predicción intuitivamente buena es que este nuevo valor es probablemente cercano a $\hat{\alpha} + \hat{\beta}x$. Las predicciones mejores indican qué tan cercano podría ser el nuevo valor (se llaman intervalos de predicción). Consideran el hecho de que $\hat{\alpha}$ y $\hat{\beta}$ son inciertos (porque dependen matemáticamente de los valores aleatorios $(y_i)$), que $\sigma$ no se conoce con certeza (y por lo tanto debe ser estimado), así como la suposición de que $Y(x)$ tiene una distribución normal con desviación estándar $\sigma$ y media $\alpha + \beta x$ (¡nota la ausencia de sombreros!).

Destaca especialmente que esta predicción tiene dos fuentes separadas de incertidumbre: la incertidumbre en los datos $(x_i, y_i)$ lleva a la incertidumbre en la pendiente estimada, la ordenada al origen y la desviación estándar residual ($\sigma$); además, hay incertidumbre en qué valor de $Y(x)$ ocurrirá. Esta incertidumbre adicional--porque $Y(x)$ es aleatorio--caracteriza las predicciones. Una predicción puede parecerse a una estimación (después de todo, $\hat{\alpha} + \hat{\beta}x$ estima $\alpha+\beta x :-) e incluso puede tener la misma fórmula matemática ($p(\mathbf{x})$ a veces puede ser la misma que $t(\mathbf{x})$), pero vendrá con una mayor cantidad de incertidumbre que la estimación.

Aquí, entonces, en el ejemplo de OLS, vemos la distinción claramente: una estimación conjetura los parámetros (que son números fijos pero desconocidos), mientras que una predicción conjetura el valor de una cantidad aleatoria. La fuente de confusión potencial es que la predicción generalmente se basa en los parámetros estimados y podría incluso tener la misma fórmula que un estimador.

En la práctica, puedes distinguir estimadores de predictores de dos maneras:

  1. propósito: un estimador busca conocer una propiedad del verdadero estado de naturaleza, mientras que una predicción busca adivinar el resultado de una variable aleatoria; y

  2. incertidumbre: un predictor generalmente tiene una mayor incertidumbre que un estimador relacionado, debido a la incertidumbre adicional en el resultado de esa variable aleatoria. Los predictores bien documentados y descritos, por lo tanto, suelen venir con bandas de incertidumbre - intervalos de predicción - que son más anchos que las bandas de incertidumbre de los estimadores, conocidos como intervalos de confianza. Una característica característica de los intervalos de predicción es que pueden (hipotéticamente) reducirse a medida que crece el conjunto de datos, pero no se reducirán a un ancho de cero - la incertidumbre en el resultado aleatorio es "irreducible" - mientras que los anchos de los intervalos de confianza tenderán a reducirse a cero, correspondiendo a nuestra intuición de que la precisión de una estimación puede volverse arbitrariamente buena con cantidades suficientes de datos.

Al aplicar esto para evaluar posibles pérdidas de inversión potenciales, primero considera el propósito: ¿quieres saber cuánto podrías perder realmente en esta inversión (o esta cesta de inversiones en particular) durante un período dado, o realmente solo estás adivinando cuál es la pérdida esperada (sobre un gran universo de inversiones, ¿quizás)? Lo primero es una predicción, lo segundo es una estimación. Luego considera la incertidumbre. ¿Cómo cambiaría tu respuesta si tuvieras recursos casi infinitos para recopilar datos y realizar análisis? Si se volviera muy precisa, probablemente estás estimando el rendimiento esperado de la inversión, mientras que si sigues altamente inseguro sobre la respuesta, estás haciendo una predicción.

Por lo tanto, si aún no estás seguro de qué animal estás tratando, pregúntale esto a tu estimador/predictor: ¿Qué tan probable es que esté equivocado y por qué? Mediante ambos criterios (1) y (2) sabrás lo que tienes.

0 votos

¡Respuesta muy interesante! ¿Puedes proporcionarnos algunas referencias al respecto?

4 votos

@user1420303 Aquí tienes dos citas. (1) Kiefer, Introducción a la Inferencia Estadística (1987), p. 30. ("Un problema de predicción es aquel en el que la decisión es una suposición no de alguna propiedad de $F$, sino más bien de alguna propiedad de una variable aleatoria... .") (2) Hahn & Meeker, Intervalos Estadísticos (1991). Ver la sección 2.3 para ejemplos e interpretaciones.

0 votos

+1. Me encontré con tu respuesta porque estoy tratando de entender la diferencia terminológica entre BLUE y BLUP en modelos mixtos, y aún no estoy seguro de entenderlo. En caso de un modelo mixto $y=\alpha+\beta x + u_i + \epsilon$, donde los interceptos aleatorios $u_i \sim \mathcal N(0, \sigma^2_u)$, estimamos $\alpha, \beta, \sigma,$ y $\sigma_u$. Luego podemos predecir $y$. Esta diferencia la entiendo. Pero ¿qué pasa con $u_i$? Se calculan con un BLUP, es decir, con un "predictor"; pero parece que con $n \to \infty$ cualquier incertidumbre desaparece, entonces ¿no deberíamos decir que $u_i$ está estimado?

8voto

Arif Puntos 61

La estimación siempre es para un parámetro desconocido, mientras que la predicción es para una variable aleatoria.

6 votos

Predices una realización de una variable aleatoria mientras estimas un parámetro de una variable aleatoria (por ejemplo, su valor esperado).

0 votos

@CowboyTrader, No sé lo suficiente sobre la estimación de densidad del núcleo para comentar sobre tu afirmación.

3voto

JohnRos Puntos 3211

No hay diferencia en los modelos. De hecho, hay una diferencia (ligera) en la acción llevada a cabo. La estimación es la calibración de tu modelo probabilístico usando datos ("aprendizaje" en la terminología de inteligencia artificial). La predicción es la "adivinanza" de una observación futura. Suponiendo que esta "adivinanza" se base en datos pasados, esto podría ser un caso de estimación; como la predicción de la altura de la próxima persona que estás a punto de conocer usando una estimación de la altura media en la población. Sin embargo, observa que la predicción no siempre es una instancia de estimación. El género de la próxima persona que estás a punto de conocer, no es un parámetro de la población en el sentido clásico; Predecir el género, podría requerir alguna estimación, pero requerirá algo más...

En el caso del valor en riesgo, la predicción y la estimación coinciden ya que tu pérdida predicha, es la expectativa estimada de la pérdida.

2 votos

Comienzas bien con una distinción correcta entre estimación y predicción, pero luego los últimos dos tercios de la respuesta parecen confundir una vez más la predicción con la estimación. La introducción del ejemplo del género se vuelve aún más confusa, porque no está relacionado con la distinción inicial (de hecho, es absurdo, porque subyace en ello un cambio de modelo estadístico entre la estimación y el paso de predicción).

0voto

Jim Herrick Puntos 84

La predicción es el uso de la función de regresión de muestra para estimar un valor para la variable dependiente condicionada a algunos valores no observados de la variable independiente.

La estimación es el proceso o técnica de calcular un parámetro desconocido o cantidad de la población.

3 votos

La brevedad es loable, pero aquí podría llevar a confusión. La predicción no se limita a aplicaciones de regresión: es tan general como la estimación. De todas formas, ¿qué exactamente quieres decir con "condicionado a algunos valores no observados de la variable independiente"? ¿Es solo una manera de decir que la predicción requiere datos? Si es así, ¿qué hay de la estimación, para la cual no proporcionas tal requisito? Tu descripción parece un ejercicio de libro de texto, como por ejemplo "¿cuál es la media de una distribución Normal cuya desviación estándar es $1$ y el cuartil superior es $2$?" ¿La estimación necesita datos o no?

-3voto

s.s.o Puntos 125

Encuentro las siguientes definiciones más explicativas:

La estimación es la aproximación calculada de un resultado. Este resultado podría ser una predicción pero no necesariamente. Por ejemplo, puedo estimar que el número de automóviles en el Puente Golden Gate a las 5 PM de ayer era de 900 suponiendo que los tres carriles que van hacia Marin estaban al límite de su capacidad, cada automóvil ocupa 30 pies de espacio, y el puente tiene 9000 pies de longitud (9000 / 30 x 3 = 900).

La extrapolación es estimar el valor de una variable fuera de un rango conocido de valores asumiendo que el valor estimado sigue algún patrón de los valores conocidos. La forma más simple y popular de extrapolación es estimar una tendencia lineal basada en los datos conocidos. Alternativas a la extrapolación lineal incluyen la extrapolación polinómica y cónica. Al igual que la estimación, la extrapolación se puede utilizar para pronósticos pero no se limita a pronósticos.

La predicción es simplemente decir algo sobre el futuro. Las predicciones suelen centrarse en resultados y no en el camino hacia esos resultados. Por ejemplo, podría predecir que para el 2050 todos los vehículos estarán alimentados con motores eléctricos sin explicar cómo pasamos de una baja adopción en 2011 a una adopción total para el 2050. Como se puede ver en el ejemplo anterior, las predicciones no necesariamente están basadas en datos.

La predicción es el proceso de realizar un pronóstico o predicción. Los términos pronóstico y predicción a menudo se usan indistintamente, pero a veces los pronósticos se distinguen de las predicciones en que los pronósticos a menudo proporcionan explicaciones de los caminos hacia un resultado. Por ejemplo, un pronóstico de adopción de vehículos eléctricos podría incluir el camino hacia la adopción total de vehículos eléctricos siguiendo un patrón de adopción en forma de S donde pocos autos son eléctricos antes de 2025, se produce un punto de inflexión en 2030 con una rápida adopción, y la mayoría de los autos son eléctricos después de 2040.

La estimación, la extrapolación, la predicción y el pronóstico no son términos mutuamente excluyentes y exhaustivamente exhaustivos. Los buenos pronósticos a largo plazo para problemas complejos a menudo necesitan utilizar técnicas distintas de la extrapolación para producir resultados plausibles. Los pronósticos y predicciones también pueden ocurrir sin ningún tipo de estimaciones calculadas.

ver enlaces definitions1 definitions2

2 votos

La predicción no tiene que ser necesariamente sobre el futuro.

0 votos

Lee todo: La predicción es simplemente decir algo sobre el futuro. Las predicciones suelen estar focalizadas en los resultados y no en el camino hacia esos resultados.

0 votos

Sí, pero los resultados no necesitan estar en el futuro. Por ejemplo, también puedes predecir resultados desconocidos pasados.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X