8 votos

Buscando una distribución donde: media = 0, varianza es variable, la inclinación = 0 y curtosis es variable

Tengo el propósito de ejecutar las simulaciones con el fin de estimar la influencia de la distribución de $Y$ (variable independiente) en un cierto resultado binario $X$ (variable dependiente). $Y$ debe siempre tiene una media de 0 y deben ser simétricas (sesgo = 0), pero me gustaría variar de forma independiente de la varianza (eventualmente de 1 a 250) y la curtosis (de un cuadrado a un pico estrecho, finalmente, de -1.2 3) de $Y$.

He estado mirando una variedad de distribuciones, pero yo no he encontrado ninguna que parecía adecuado para este tipo de propósito.

Me pueden ayudar a elegir una distribución desde el que se puede cambiar fácilmente la varianza, curtosis, manteniendo la media y la inclinación a cero?

EDICIONES

Más descripciones

Me di cuenta de que todavía hay preguntas abiertas (no muchos). Mis preferencias son:

  • media = 0
  • variación: puede variar
  • simétrica: Sí (no me di cuenta al principio que skew=0 no implica simetría).
  • curtosis: puede variar de forma independiente de la varianza
  • número de modos: unimodal (no estricto en este tema)
  • Delimitado: no importa.
  • continuo/discreto: no importa. Voy a tener que tomar una discreta aproximaciones si es continua pero no me importa
  • La cola de Comportamiento: estoy muy interesado en el impacto de la cola. Pensé que, al permitir que la curtosis para el cambio fue suficiente como una descripción, pero tal vez debería describir los momentos de orden superior...

Contexto

Estoy trabajando en el campo de la genética de poblaciones y estoy interesado en la influencia de la varianza y la curtosis de la dispersión del núcleo ($Y$) sobre la probabilidad de fijación de un alelo ($X$). No me interesa para simular casos donde la distribución de la dispersión es sesgada y la media siempre debe estar en la posición de la deme de los padres (esto puede muy fácilmente resuelto por la simple adición de todos modos). Estudios previos han sostenido (sin mostrar ninguna evidencia) que la varianza y la curtosis son importantes y de estudios empíricos mostraron que la dispersión del núcleo es a menudo leptokurtic. No estoy seguro que se tratan correctamente tu comentario. ¿He? Gracias

5voto

AdamSane Puntos 1825

Hay muchas posibilidades. Una posibilidad es tomar un par de familias para cubrir positivo y negativo del exceso de curtosis, y cuando la coincidencia de los cuatro primeros momentos de los candidatos obvios son Pearson-distribuciones de la familia.

La familia de la escala t-distribuciones de parámetros ( $\sigma$ $\nu$ ) que afectan a la varianza y la curtosis. Sólo pueden tener curtosis por encima de la normal, sin embargo.

Que tienen exceso de curtosis $\frac{6}{\nu-4}$ (por lo que si desea que sólo ir tan alto como 3, usted querrá $\nu\geq 6$).

Tiene varianza $\sigma^2 \frac{\nu}{\nu-2}$, por lo que da $\nu$ usted puede elegir $\sigma$ para el rendimiento de la varianza deseada

La familia de escala desplazado (a media 0) distribuciones beta, a continuación, tendría que cuidar el caso de que la curtosis fue menor que la de la normal (que ambas familias se incluyen el normal como el caso límite). Así que toma un $\text{Beta}(\alpha,\alpha)$ y desplazamiento hacia abajo por $\frac{1}{2}$ y, a continuación, la escala deseada de la varianza.

Que es un $\text{Beta}(\alpha,\alpha)$ tiene exceso de curtosis $-\frac{6}{ (2\alpha + 3)}$, e incluye su deseado uniforme en $\alpha=1$.

Antes de escalar tiene la varianza $\frac{1}{4(2\alpha+1)}$; la proporción de la varianza que sin escala de varianza será la plaza de la escala requerida.

enter image description here

5voto

georgiana Puntos 6

Tener una mirada en la pesada cola Lambert W x F distribuciones (descargo de responsabilidad: yo soy el autor). La variable aleatoria $Y \sim Lambert W \times F$ es un pesado-cola versión de $X\sim F$, donde el control de la cola con la cola del parámetro $\delta \geq 0$: para $\delta = 0$, $X = Y$ y así Lambert W x F es el mismo que F; y para $\delta \rightarrow \infty$ obtendrá más y más pesadas colas en $Y$ (Tukey h es un caso especial de Lambert W x F variables aleatorias F = Gaussiano y $\alpha = 1$).

Tenga en cuenta que esto funciona para cualquier (no patológico) distribución continua, y no sólo el de la distribución Normal.

Para su petición particular, de media = 0, simétrica, y la varianza de la variable y la curtosis puede establecer $\mu = 0$, $\delta_{\ell} = \delta_r = \delta$ (de forma predeterminada), y variar la escala de $\sigma$ y la cola del parámetro $\delta$.

En R se aplica esto en la LambertW (paquete de uso type = "h" y distname = "normal").

Véase también (mi) relacionados con las respuestas aquí:

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X