¿Cuándo no puedo sustituir una variable aleatoria por su media?

Question

¿Cuándo no puedo sustituir una variable aleatoria por su media?

Preguntado el 24 de Octubre, 2017: Cuando se hizo la pregunta
1309 visitas: Cuantas visitas ha tenido la pregunta
3 Respuestas: Cuantas respuestas ha tenido la pregunta
Resuelta: Estado actual de la pregunta

Una simplificación frecuente en la modelización y la simulación es sustituir una variable aleatoria por su valor medio.

¿Cuándo esta simplificación llevaría a una conclusión errónea?

Preguntado el 24 de Octubre, 2017 por Ankit Goyal

2 votos

¿Significa "Var" variable o desviación o Valor en riesgo ?

Comentado el 25 de Octubre, 2017 por Alan

3 votos

Sería divertido crear un servicio que pagara la suscripción a Netflix de sus miembros. Sólo cobraríamos $\left|x\right|~\frac{\mathrm{USD}}{\mathrm{month}}$ , donde $x$ se selecciona aleatoriamente en el dominio $\left[-100,100\right]$ Así que, ya sabes, ¡netflix gratis! Más adelante, ofreceremos a algunos clientes la opción de pagar $x^2~\frac{\mathrm{USD}}{\mathrm{month}}$ .

Comentado el 25 de Octubre, 2017 por Chemical Engineer

3 votos

Bueno, en un caso muy simple, si lo llevamos al extremo podríamos perder casi toda la información que nos interesa. Consideremos una regresión de Y sobre X en la que sustituimos tanto Y como X por su media. Cualquier información sobre la pendiente se pierde ahora.

Comentado el 25 de Octubre, 2017 por jamesh

Mostrar 1 comentarios más

Answer 1

3 Respuestas

Answer 2

20voto

icelava Puntos 548

Si sustituye un valor perdido por una estimación puntual, no tendrá en cuenta toda su variabilidad. Por lo tanto, no propagará toda la variabilidad original a su modelo. Sus estimaciones de los parámetros parecerán demasiado bajas error estándar s. Si haces inferencia, tus valores p estarán sesgados a la baja. Su intervalo de confianza s será demasiado estrecho. Si hace predicción, su intervalo de predicción s será demasiado estrecho.

En general: estará demasiado seguro de sus conclusiones.

Respondido el 24 de Octubre, 2017 por icelava (548 Puntos )

2 votos

Buena respuesta Piénsalo así: Una variable aleatoria tiene una distribución. Puede ser skwed a la izquierda, a la derecha. Puede ser bimodal, etc. Al reducir la variable a su valor medio, se elimina toda esa información adicional (incertidumbre) y se sustituye una distribución (intervalos) por una única estimación puntual.

Comentado el 25 de Octubre, 2017 por nat

1 votos

Si sustituye un valor perdido por una estimación puntual, también está asumiendo que los datos faltan al azar. El valor medio de la variable aleatoria podría no ser igual al valor medio de los datos cuando faltan.

Comentado el 25 de Octubre, 2017 por andynormancx

0 votos

@NeilG siento ser quisquilloso, pero reemplazar un valor perdido por su media no significa directamente asumir que los datos faltan al azar. Sobre todo porque la terminología - un poco confusa - en torno a los datos que faltan considera que "faltan al azar" son datos que faltan al azar condicionado a otros datos, pero conocidos ( es.wikipedia.org/wiki/Datos_faltantes ). En mi opinión, la forma en que se sustituyen los datos no implica nada sobre el razonamiento que hay detrás. Ese razonamiento debería hacerse explícito y conducir a la forma adecuada de tratar los datos que faltan. Dicho esto, estoy totalmente de acuerdo con la respuesta de Stephan.

Comentado el 27 de Octubre, 2017 por IWS

Mostrar 4 comentarios más

Answer 3

14voto

kormolla Puntos 11

Además de los puntos de Stephan:

En casi cualquier aplicación en la que esté interesado en funciones no lineales de la variable aleatoria, la sustitución de la media generalmente introducirá un sesgo y posiblemente resultados contradictorios. La velocidad media y la masa media de una partícula generalmente no serán consistentes con la energía cinética media, porque la energía escala con V^2.
El valor medio puede ni siquiera ser un resultado posible para la variable aleatoria. Si mis posibles resultados son 0 "el paciente muere" y 1 "el paciente vive", probablemente no sea útil tener un modelo que describa al paciente como 0,1 "mayormente muerto pero ligeramente vivo".

Respondido el 25 de Octubre, 2017 por kormolla (11 Puntos )

1 votos

Obligatorio: youtube.com/watch?v=xbE8E1ez97M

Comentado el 25 de Octubre, 2017 por GenericTypeTea

1 votos

¡@Alexis pero por supuesto!

Comentado el 25 de Octubre, 2017 por kormolla

Answer 4

0voto

Marguerite Navie Puntos 6

Un ejemplo de la vida real (relacionado con las dos respuestas que has obtenido), en los mercados financieros. El precio de una opción se basa en la probabilidad de que el precio de un activo suba (o baje) de un nivel determinado.

Por ejemplo, el precio de una opción de compra de un activo a un precio de 100 cuando el valor esperado del activo es de 80. Si se sustituye la variable aleatoria (el precio del activo) por su media, se obtendría un precio de cero (ya que nunca se compraría a 100 un activo que cuesta 80). Si se tiene en cuenta la estocasticidad del activo (y esa es la forma correcta de hacerlo) se obtiene un precio positivo, ya que existe cierta probabilidad de que el precio del activo supere los 100.

Respondido el 27 de Octubre, 2017 por Marguerite Navie (6 Puntos )

¿Cuándo no puedo sustituir una variable aleatoria por su media?

Respuestas

Preguntas Destacadas

Etiquetas mas usadas

i-Ciencias.com

Powered by:

¿Cuándo no puedo sustituir una variable aleatoria por su media?

Respuestas

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

i-Ciencias.com

Powered by: