Tengo un número muy grande de observaciones. Observaciones llegar de forma secuencial. Cada observación es un $n$-dimensiones del vector (con $n \ge 100$), es independiente de los otros y se extrae de la misma desconocido de distribución. Hay una política óptima para estimar el desconocido de distribución, teniendo en cuenta algunas espacio de límites en el número de observaciones que se pueden almacenar? Me gustaría salir de la estimación de los criterios de composición abierta, en términos de lo esperado o minimax error asintótico de consistencia, aysmptotic eficiencia, etc.).
Respuesta
¿Demasiados anuncios?Si usted no tiene ninguna razón para sospechar de más de un modo en los datos, luego de una distribución normal multivariante no es un mal ir primero. Usted acaba de calcular la media de vector y matriz de covarianza, y ahí está el PDF.
Sin embargo, esta es una muy áspera respuesta, y me parece que con 100 observaciones, usted probablemente tendrá multi-modal de datos. Normal, sólo se ve como uno de los grandes llanos multi-dimensional de la montaña. De los datos, probablemente se vería más como una multi-dimensional de la cordillera (con un montón de locales jorobas).