11 votos

¿Cuándo no puedo sustituir una variable aleatoria por su media?

Una simplificación frecuente en la modelización y la simulación es sustituir una variable aleatoria por su valor medio.

¿Cuándo esta simplificación llevaría a una conclusión errónea?

2 votos

¿Significa "Var" variable o desviación o Valor en riesgo ?

3 votos

Sería divertido crear un servicio que pagara la suscripción a Netflix de sus miembros. Sólo cobraríamos $\left|x\right|~\frac{\mathrm{USD}}{\mathrm{month}}$ , donde $x$ se selecciona aleatoriamente en el dominio $\left[-100,100\right]$ Así que, ya sabes, ¡netflix gratis! Más adelante, ofreceremos a algunos clientes la opción de pagar $x^2~\frac{\mathrm{USD}}{\mathrm{month}}$ .

3 votos

Bueno, en un caso muy simple, si lo llevamos al extremo podríamos perder casi toda la información que nos interesa. Consideremos una regresión de Y sobre X en la que sustituimos tanto Y como X por su media. Cualquier información sobre la pendiente se pierde ahora.

20voto

icelava Puntos 548

Si sustituye un valor perdido por una estimación puntual, no tendrá en cuenta toda su variabilidad. Por lo tanto, no propagará toda la variabilidad original a su modelo. Sus estimaciones de los parámetros parecerán demasiado bajas error estándar s. Si haces inferencia, tus valores p estarán sesgados a la baja. Su intervalo de confianza s será demasiado estrecho. Si hace predicción, su intervalo de predicción s será demasiado estrecho.

En general: estará demasiado seguro de sus conclusiones.

2 votos

Buena respuesta Piénsalo así: Una variable aleatoria tiene una distribución. Puede ser skwed a la izquierda, a la derecha. Puede ser bimodal, etc. Al reducir la variable a su valor medio, se elimina toda esa información adicional (incertidumbre) y se sustituye una distribución (intervalos) por una única estimación puntual.

1 votos

Si sustituye un valor perdido por una estimación puntual, también está asumiendo que los datos faltan al azar. El valor medio de la variable aleatoria podría no ser igual al valor medio de los datos cuando faltan.

0 votos

@NeilG siento ser quisquilloso, pero reemplazar un valor perdido por su media no significa directamente asumir que los datos faltan al azar. Sobre todo porque la terminología - un poco confusa - en torno a los datos que faltan considera que "faltan al azar" son datos que faltan al azar condicionado a otros datos, pero conocidos ( es.wikipedia.org/wiki/Datos_faltantes ). En mi opinión, la forma en que se sustituyen los datos no implica nada sobre el razonamiento que hay detrás. Ese razonamiento debería hacerse explícito y conducir a la forma adecuada de tratar los datos que faltan. Dicho esto, estoy totalmente de acuerdo con la respuesta de Stephan.

14voto

kormolla Puntos 11

Además de los puntos de Stephan:

  • En casi cualquier aplicación en la que esté interesado en funciones no lineales de la variable aleatoria, la sustitución de la media generalmente introducirá un sesgo y posiblemente resultados contradictorios. La velocidad media y la masa media de una partícula generalmente no serán consistentes con la energía cinética media, porque la energía escala con V^2.
  • El valor medio puede ni siquiera ser un resultado posible para la variable aleatoria. Si mis posibles resultados son 0 "el paciente muere" y 1 "el paciente vive", probablemente no sea útil tener un modelo que describa al paciente como 0,1 "mayormente muerto pero ligeramente vivo".

1 votos

1 votos

¡@Alexis pero por supuesto!

0voto

Un ejemplo de la vida real (relacionado con las dos respuestas que has obtenido), en los mercados financieros. El precio de una opción se basa en la probabilidad de que el precio de un activo suba (o baje) de un nivel determinado.

Por ejemplo, el precio de una opción de compra de un activo a un precio de 100 cuando el valor esperado del activo es de 80. Si se sustituye la variable aleatoria (el precio del activo) por su media, se obtendría un precio de cero (ya que nunca se compraría a 100 un activo que cuesta 80). Si se tiene en cuenta la estocasticidad del activo (y esa es la forma correcta de hacerlo) se obtiene un precio positivo, ya que existe cierta probabilidad de que el precio del activo supere los 100.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X