El tapizado es decir, desde donde se están iniciando, una generalización de la mediana. Si usted trim (en el sentido de ignorar antes que caer) 3 valores en cada cola de un ordenado muestra de 7 a continuación, obtener la mediana; si recorta los valores 0, entonces se obtiene de la media. Para muestras pequeñas, pensar en términos de número de tapizados es natural. Aquí es un Programa basado en el cálculo con los "datos" mediante la publicación de código con Cox (2013), pero el resultado debe ser bastante transparentes para los usuarios de otros programas de software:
set obs 7
mat A = (1, 1, 1, 2, 2, 2, 3)
mat B = (1, 2, 2, 2, 3, 3, 3)
gen A = A[1, _n]
gen B = B[1, _n]
trimmean A, number(0/3)
+---------------------------+
| number # trimmed mean |
|---------------------------|
| 0 7 1.714286 |
| 1 5 1.6 |
| 2 3 1.666667 |
| 3 1 2 |
+---------------------------+
trimmean B, number(0/3)
+---------------------------+
| number # trimmed mean |
|---------------------------|
| 0 7 2.285714 |
| 1 5 2.4 |
| 2 3 2.333333 |
| 3 1 2 |
+---------------------------+
Como común, los resultados se muestran a más posiciones decimales que serán necesarios.
Para muestras más grandes, es más natural, y ciertamente convencional, a pensar en términos de la fracción o porcentaje de tapizados. El 25% tapizados significa que se le ha dado diversos nombres, siendo los más comunes "midmean". (Aquellos que están familiarizados con diagramas de caja puede pensar en él como la media de los valores que caen dentro de la caja.)
Las ventajas de tapizados medios incluyen
La facilidad de comprensión y de cálculo. Tapizados de los medios usados en el juicio de los deportes como una forma de descuento o desalentar el sesgo en la votación, por lo que incluso puede ser familiar para los usuarios de las estadísticas de fuera del campo.
Claro enlaces estándar de ideas, la media y la mediana.
Flexibilidad en la elección de esa mezcla de resistencia a la salvaje valores y uso de la información en el resto de valores que es un buen trade-off en un proyecto.
Las desventajas incluyen el
La flexibilidad es otro nombre para la arbitrariedad. No es fácil ver cuál es la mejor de las extensiones de bivariante o multivariante de los casos sería.
Los valores se incluyen o no, al menos en el más simple sabor de tapizados significa, que no puede ser suficientemente sutil.
Tapizados en otros medios que la limitación de los casos de la media y la mediana de perder muchas de las atractivas propiedades de cualquiera de ellos, incluyendo el equivariance de la mediana y monótona de las transformaciones de manifiesto por @whuber.
Cox (2013) es una revisión tutorial haciendo hincapié en la historia de las ideas y gráficos asociados. (Se asoma a una breve mención de Jules Verne.)
Cox, N. J. 2013. Hablando de Stata: Cortar al gusto.
Stata Journal 13: 640-666.
http://www.stata-journal.com/article.html?article=st0313