Supongamos que usted está tratando de estimar el pdf de una variable aleatoria $X$, por lo que hay un montón de me.yo.d. las muestras de $\{X_i\}_{i=1}^{n}$ ($n$ es muy grande, pensar en miles de millones).
Una opción es estimar la media y la varianza, y simplemente asumir que es Gaussiano.
En el otro extremo, uno puede tomar núcleo estimaciones de densidad, para obtener algo más preciso (especialmente cuando hay tantos datos).
El problema es, que necesito para evaluar el pdf resultante muy, muy rápido. Si asumimos que el pdf es Gaussiano, a continuación, evaluar el pdf $f_X(x)$ es muy rápido, pero la estimación podría no ser exacta. Por otro lado, las estimaciones de densidad de kernel va a ser demasiado lento para su uso.
Así que la pregunta es: ¿cuáles son las formas más comunes para obtener pdf estima que son más generales que Gaussianas, pero en un incremento de la moda? Idealmente, me gustaría tener un modelo con un número de parámetros (es decir $k$), que puede ser utilizado para el trade-off precisión de la estimación y la evaluación de la velocidad.
Las posibles direcciones que he pensado son:
La estimación de los momentos de la distribución, y encontrar los pdf basado en estos momentos de soledad. $k$ aquí es el número de momentos. Pero entonces, ¿cuál es el modelo para el pdf basado en el modelo?
Gauss mezclas con $k'$ mezclas (aquí $k=3k'-1$ ya que para cada elemento de la mezcla mantenemos la media, la varianza y el peso, y la suma de los pesos de a uno). Es esta una buena idea?
Otras ideas son bienvenidas.
Gracias!
Preguntas relacionadas: estimación ML;
Actualización / aclaración:
Gracias por todas las respuestas hasta el momento.
Realmente necesito el pdf (no el cdf, y no a la muestra de esta distribución). Específicamente, estoy usando el escalar pdf estimaciones para Naive Bayes (NB) de clasificación y regresión: dada la etiqueta, cada una de las características que tiene un pdf, y el NB asunción dice que son independientes. Así que para calcular la parte posterior (la probabilidad de que la etiqueta dada la característica de los valores) necesito los diferentes archivos pdf que se evalúa en la característica que se observa en los valores.