4 votos

Cómo corregir la desigual distribución de muestreo a la hora de calcular la media?

Supongamos que tengo una función f, y quiero probar los 100 puntos en el intervalo [0, 100]. Por alguna razón (que parecía inteligente para mí en ese momento), me decidí a no de la muestra en intervalos equidistantes, sino más bien utilizar la siguiente función para determinar los puntos de muestra:

log2(x)*(100/log2(100))

Esto me da una secuencia de puntos de muestreo que se hace más densa a medida que se aproxima 100. El problema es que ahora necesito para calcular la media sobre los valores que he probado, pero debido a la mala toma de muestras que sería muy sesgada. No puedo volver a muestrear los datos, esto puede tomar mucho tiempo (varios días), y estoy en una agenda muy apretada. Así, la solución que viene a la mente es calcular un promedio ponderado para corregir el error. Mi pregunta es, ¿cómo puedo determinar los pesos?

7voto

jldugger Puntos 7490

La respuesta depende de las características de $f$. Independientemente, de su medio (por definición) es $\frac{1}{100}\int_0^{100}{f(x)dx}$, por lo que su problema es de estimar que la integral a partir de los valores en un conjunto discreto de puntos. Para una muy discontinua la función se puede utilizar cualquier suma de Riemann; para una función derivable uso de la Regla Trapezoidal, para lo cual se puede estimar el error en términos de los derivados de la $f$; para un tres veces derivable la función de usar la Regla de Simpson, etc. Si es necesario, se pueden combinar las estimaciones de error de las siguientes reglas de estadística de las estimaciones del error en la computación de cada valor de $f$ para obtener una estimación del error en el promedio.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X