Las fórmulas están disponibles en varios lugares, incluyendo Wikipedia .
La clave está en darse cuenta de que depende de lo que signifiquen los pesos . En particular, obtendrá respuestas diferentes si las ponderaciones son frecuencias (es decir, sólo intenta evitar la suma total), si las ponderaciones son de hecho la varianza de cada medida, o si son sólo algunos valores externos que impone a sus datos.
En tu caso, superficialmente parece que los pesos son frecuencias pero no son . Usted genera sus datos a partir de frecuencias, pero no es una simple cuestión de tener 45 registros de 3 y 15 registros de 4 en su conjunto de datos. En su lugar, necesitas utilizar el último método. (En realidad, todo esto es una tontería usted realmente ¡necesita utilizar un modelo más sofisticado del proceso que está generando estos números! Al parecer, usted no tener algo que escupe números distribuidos normalmente, por lo que caracterizar el sistema con la desviación estándar no es lo correcto).
En cualquier caso, la fórmula de la varianza (a partir de la cual se calcula la desviación estándar de forma normal) con pesos de "fiabilidad" es
$${ \sum {w_i (x_i - x^*)^2} \over {\sum w_i - {\sum w_i^2 \over \sum w_i }} }$$
donde $x^* = \sum w_i x_i / \sum w_i$ es la media ponderada.
No tienes una estimación de los pesos, que supongo que quieres tomar para que sean proporcionales a la fiabilidad. Tomar los porcentajes de la forma en que lo estás haciendo va a hacer que el análisis sea complicado incluso si son generados por un proceso de Bernoulli, porque si obtienes una puntuación de 20 y 0, tienes un porcentaje infinito. La ponderación por la inversa del SEM es algo común y a veces óptimo. Quizás debas utilizar una estimación bayesiana o Intervalo de puntuación de Wilson .
0 votos
La fórmula con (M-1)/M es correcta. Si tienes alguna duda, compruébala poniendo todas las ponderaciones iguales a 1, y obtendrás la fórmula clásica para la estimación insesgada de la desviación típica con (N-1) en el denominador. Para quien lo tenga claro: inusual no significa incorrecto.
1 votos
La fórmula con (M-1)/M NO ES CORRECTA. Imagina que sumas un millón de puntos con pesos de una trillonésima. No cambia la respuesta en absoluto independientemente de cuáles sean esos pesos, pero su $(M-1)/M$ ¿el plazo se convierte en 1? No hay duda de que no. Si le importa que $(M-1)/M \neq 1$ Entonces también te importa que esto esté mal.
0 votos
El voto más alto es correcto. Por favor, compruebe itl.nist.gov/div898/software/dataplot/refman2/ch2/weightsd.pdf
0 votos
Me pregunto por qué ¿Quieres la desviación estándar aquí? Sólo tienes $4$ ¡números! ¿Cómo pueden ser demasiados números? Especialmente cuando los porcentajes son más fáciles de explicar y entender.
3 votos
@probabilityislogic era un ejemplo simplificado para mantener la pregunta corta.