En estadística bayesiana, si mi variable tiene distribución gaussiana y tengo un prior conjugado, puedo resolver el posterior analíticamente. Puedo seguir utilizando MCMC en el caso de que las cosas no sean gaussianas, siempre que designe una distribución. Pero, ¿y si no sé cuál es la distribución adecuada? Estoy trabajando con datos financieros que se sabe que no son gaussianos (colas más pesadas y sesgadas en relación con una distribución normal). Que yo sepa, la distribución exacta de los datos financieros sigue siendo objeto de debate en el mundo académico. ¿Cuál sería una alternativa si no quiero hacer una fuerte suposición sobre cómo se distribuyen los datos?
Respuestas
¿Demasiados anuncios?Si la distribución de los datos es desconocida, la forma bayesiana de tratar esta incertidumbre es poner una prioridad sobre ella. Existe una enorme bibliografía sobre No paramétrica bayesiana incluida la Fundamentos de la inferencia bayesiana no paramétrica por Ghosal y van der Vaart . Los priors por defecto en tales configuraciones son distribuciones sobre distribuciones, como los procesos Dirichlet. Consulte, por ejemplo, la página web Tutoriales sobre no parametría bayesiana mantenido por Peter Orbanz . He aquí una lista de artículos de referencia a nuestros alumnos.
Con respecto a MCMC, existen algoritmos MCMC que también manejan no paramétricos bayesianos. Véase, por ejemplo libro de Dey et al. Compruebe también el proceso dirichlet en este foro.
Una solución más suave es utilizar Promedio bayesiano de modelos es decir, enumerar todas (!) las familias plausibles que podrían ajustarse a los datos, elegir una prioridad de referencia para cada una y utilizar la mezcla posterior para las cantidades de interés [comunes a todas las familias].
De lo que dices es que quieres algo bayesiano, pero no puedes definir la probabilidad. Para estos casos existe cálculo bayesiano aproximado (véase abc ), donde en lugar de la probabilidad se utilizan algunos estadísticos de resumen.
Como nota al margen, para utilizar un análisis bayesiano adecuado no es necesario conocer la distribución "exacta". Casi nunca la conocemos. Es necesario utilizar alguna distribución que se aproxime relativamente bien a la distribución de los datos. Así es como se hace en la mayor parte de la estadística. No usamos las distribuciones de Gauss, Poisson, etc. porque sean las distribuciones exactas de los datos observados, pero son aproximaciones suficientemente buenas para el propósito. Lo mismo se hace con la función de pérdida, no se utiliza el error cuadrático porque tenga un significado profundo para los datos, sino porque funciona lo suficientemente bien.
Aunque las otras respuestas están bien, creo que pueden ser exageradas para el tuyo o para muchos otros problemas.
Sin cambiar de paradigma, si se sabe que la distribución tiene colas más pesadas que la gaussiana, se puede ajustar la distribución t con una pesadez de colas fija o con la pesadez de colas estimada a partir de los datos, posiblemente con información a priori.
Si una distribución es sesgada y tiene colas más pesadas, se puede ajustar una distribución SHASH que tiene cuatro parámetros que parametrizan la localización, la escala, la asimetría y la curtosis de la distribución con la distribución normal como su caso especial.
Sugiero como alternativa los métodos basados en bootstrap, que pueden ser paramétricos y no paramétricos, y funcionan con muy pocos supuestos y muy pocos datos (sólo bastan 5-7 muestras); funcionan en distribuciones no gaussianas y para muchas medidas (por ejemplo, la media, etc.). Se puede "reconstruir" una distribución mediante bootstraping de la media, si tiene sentido en el contexto dado. El método Davison 1 es bueno para introducir el bootstrap en general.
Se han publicado muchos trabajos sobre la sonrisa de volatilidad analizada mediante métodos basados en bootstrap [0].
- https://scholar.google.com/scholar?q=bootstrap+volatilidad+sonrisa
- Davison, A.C. y Hinkley, D.V., 1997. Bootstrap methods and their application (nº 1). Cambridge University Press.
- El Bootstrap no paramétrico como modelo bayesiano