2 votos

Encontrar una "distribución normal sesgada" para unos datos dados

Me dan un juego de $n$ pares $(x_i, y_i)$ donde el $x$ -las coordenadas pueden interpretarse como los valores medidos de una variable aleatoria $X$ y el $y$ -pueden interpretarse como una probabilidad "a escala" correspondiente al $x$ -valor. Trazando estos pares de puntos en $\mathbb{R}^2$ obtengo los siguientes puntos:

enter image description here

Ahora debería estar claro lo que quiero decir con probabilidad "a escala": No puede ser una densidad de probabilidad ya que no está normada. Sin embargo, me gustaría pensar en ella como una probabilidad y por lo tanto me gustaría encontrar una distribución adecuada. Como parece distribuida normalmente (y, por lo que sé, una distribución normal tiene sentido para la medición), he calculado la media (ponderada) y la desviación típica y, a continuación, he trazado la distribución normal correspondiente. A continuación, multipliqué (de forma bastante arbitraria) la función de densidad por una constante para obtener una función de densidad que se ajustara mejor a mi conjunto específico de datos. Esta función a escala puede verse en la imagen de arriba.

De los datos también se desprende que la distribución está ligeramente sesgada a la izquierda. Puedo calcular la asimetría con una fórmula que encontré en wikipedia y, efectivamente, obtengo un número negativo.

Pregunta: ¿Cómo puedo explicar esta asimetría? ¿Qué debería cambiar en la función de densidad para obtener una función de densidad asimétrica que siga ajustándose a mis datos?

1voto

kjetil b halvorsen Puntos 7012

Se podría estudiar la distribución sesgada normal (véase wikipedia , estimación de la normal inclinada ) y podría utilizarla del mismo modo que utilizó la distribución normal.

Pero, a falta de saber cómo se $(x_i, y_i)$ pares, no existe un método estadístico de principio para estimar los parámetros. No parece que disponga de datos IID. Así que probablemente se trate más de un problema de aproximación de funciones, más de análisis numérico que de estadística (a menos que nos digas algún contexto).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X