Una simplificación frecuente en la modelización y la simulación es sustituir una variable aleatoria por su valor medio.
¿Cuándo esta simplificación llevaría a una conclusión errónea?
Una simplificación frecuente en la modelización y la simulación es sustituir una variable aleatoria por su valor medio.
¿Cuándo esta simplificación llevaría a una conclusión errónea?
Si sustituye un valor perdido por una estimación puntual, no tendrá en cuenta toda su variabilidad. Por lo tanto, no propagará toda la variabilidad original a su modelo. Sus estimaciones de los parámetros parecerán demasiado bajas error estándar s. Si haces inferencia, tus valores p estarán sesgados a la baja. Su intervalo de confianza s será demasiado estrecho. Si hace predicción, su intervalo de predicción s será demasiado estrecho.
En general: estará demasiado seguro de sus conclusiones.
Buena respuesta Piénsalo así: Una variable aleatoria tiene una distribución. Puede ser skwed a la izquierda, a la derecha. Puede ser bimodal, etc. Al reducir la variable a su valor medio, se elimina toda esa información adicional (incertidumbre) y se sustituye una distribución (intervalos) por una única estimación puntual.
Si sustituye un valor perdido por una estimación puntual, también está asumiendo que los datos faltan al azar. El valor medio de la variable aleatoria podría no ser igual al valor medio de los datos cuando faltan.
@NeilG siento ser quisquilloso, pero reemplazar un valor perdido por su media no significa directamente asumir que los datos faltan al azar. Sobre todo porque la terminología - un poco confusa - en torno a los datos que faltan considera que "faltan al azar" son datos que faltan al azar condicionado a otros datos, pero conocidos ( es.wikipedia.org/wiki/Datos_faltantes ). En mi opinión, la forma en que se sustituyen los datos no implica nada sobre el razonamiento que hay detrás. Ese razonamiento debería hacerse explícito y conducir a la forma adecuada de tratar los datos que faltan. Dicho esto, estoy totalmente de acuerdo con la respuesta de Stephan.
Además de los puntos de Stephan:
Un ejemplo de la vida real (relacionado con las dos respuestas que has obtenido), en los mercados financieros. El precio de una opción se basa en la probabilidad de que el precio de un activo suba (o baje) de un nivel determinado.
Por ejemplo, el precio de una opción de compra de un activo a un precio de 100 cuando el valor esperado del activo es de 80. Si se sustituye la variable aleatoria (el precio del activo) por su media, se obtendría un precio de cero (ya que nunca se compraría a 100 un activo que cuesta 80). Si se tiene en cuenta la estocasticidad del activo (y esa es la forma correcta de hacerlo) se obtiene un precio positivo, ya que existe cierta probabilidad de que el precio del activo supere los 100.
I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.
2 votos
¿Significa "Var" variable o desviación o Valor en riesgo ?
3 votos
Sería divertido crear un servicio que pagara la suscripción a Netflix de sus miembros. Sólo cobraríamos $\left|x\right|~\frac{\mathrm{USD}}{\mathrm{month}}$ , donde $x$ se selecciona aleatoriamente en el dominio $\left[-100,100\right]$ Así que, ya sabes, ¡netflix gratis! Más adelante, ofreceremos a algunos clientes la opción de pagar $x^2~\frac{\mathrm{USD}}{\mathrm{month}}$ .
3 votos
Bueno, en un caso muy simple, si lo llevamos al extremo podríamos perder casi toda la información que nos interesa. Consideremos una regresión de Y sobre X en la que sustituimos tanto Y como X por su media. Cualquier información sobre la pendiente se pierde ahora.
1 votos
¿Pregunta por la sustitución de valores perdidos o por la sustitución de una variable aleatoria en un contexto específico (por ejemplo, hacer predicciones basadas en un modelo de efectos aleatorios)?