Me pregunto ¿qué es un valor intrínseco de la utilización de la media armónica (por ejemplo, para calcular F-medidas), a diferencia ponderada media aritmética en la combinación de precisión y recall? Estoy pensando que la media aritmética ponderada podría jugar el papel de la media armónica, o me estoy perdiendo algo?
Respuestas
¿Demasiados anuncios?En general, los armónicos son los medios preferidos cuando uno está tratando de promedio de las tasas, en lugar de números enteros. En el caso de un F1 medida, una media armónica se sancione muy pequeñas precisiones o recuerda, mientras que la media aritmética, no ponderada, no. Imagina un promedio de 100% y 0%: media Aritmética es de 50% y la media Armónica es el 0%. La media armónica se requiere que tanto la precisión y el recall ser alta.
Además, cuando la precisión y el recall están muy juntas, la media armónica estará cerca de la media aritmética. Ejemplo: la media armónica de 95% y 90% 92.4% en comparación con la media aritmética de 92.5%.
Si esta es una propiedad deseable es, probablemente, depende de su caso de uso, pero en general se considera bueno.
Por último, tenga en cuenta que, como @whuber indicado en los comentarios, la media armónica es de hecho una ponderada media aritmética.
La media armónica puede ser un sustituto muy útil a la media aritmética cuando este último no tiene ninguna expectativa o ninguna variación. De hecho, puede darse el caso de que $\mathbb{E}[X]$ no existe o es infinito, mientras que $\mathbb{E}[1/X]$ existe. Por ejemplo, la distribución de Pareto con la densidad de$$f(x)=\dfrac{\alpha x_0^{\alpha}}{x^{\alpha+1}}\mathbb{I}_{x\ge x_0}$$has no finite expectation when $\alpha\le 1$, which implies that the arithmetic mean has an infinite expectation, while$$\mathbb{E}[1/X]=\int_{x_0}^\infty \dfrac{\alpha x_0^{\alpha}}{x^{\alpha+2}}\,\text{d}x=\dfrac{\alpha x_0^{\alpha}}{(\alpha+1) x_0^{\alpha+1}}=\dfrac{\alpha}{(\alpha+1) x_0}$$lo que implica que la media armónica tiene un número finito de expectativa.
Por el contrario, existen distribuciones para que la media armónica no tiene ninguna expectativa, como por ejemplo la Beta $\mathcal{B}e(\alpha,\beta)$ distribución al $\alpha\le1$. Y muchos más para el que no tiene variación.
También hay un enlace con Monte Carlo aproximaciones integrales, y en particular la normalización de las constantes, basado en la identidad posterior Bayesiana$$\mathbb{E}\left[\dfrac{\varphi(\theta)}{\pi(\theta)L(\theta|x)}\Big| x\right]=\dfrac{1}{m(x)}$$where $\varphi(\cdot)$ is any density, $\pi\cdot)$ is the prior, $L(\cdot|x)$ the likelihood, and $m(\cdot)$ marginal, como se explica en que otra pregunta sobre X validado, donde puedo comentar sobre los peligros de usar lo Radford Neal (U de Toronto) llama a la peor de Monte Carlo estimador de siempre. (También escribí varias entradas en mi blog sobre ese tema.)