Tengo un montón (alrededor de 1000) de estimaciones y se supone que todas son estimaciones de la elasticidad a largo plazo. Algo más de la mitad de ellas se estiman con el método A y el resto con un método B. En algún sitio leí algo así como "Creo que el método B estima algo ". muy diferente del método A, porque las estimaciones son mucho más elevadas (50-60%)". Mis conocimientos de estadística robusta son casi nulos, así que sólo calculé las medias y medianas muestrales de ambas muestras... y enseguida vi la diferencia. El método A está muy concentrado, la diferencia entre la mediana y la media es muy pequeña, pero la muestra del método B variaba salvajemente.
Llegué a la conclusión de que los valores atípicos y los errores de medición sesgan la muestra del método B, así que deseché unos 50 valores (alrededor del 15%) que eran muy incoherentes con la teoría... y de repente las medias de ambas muestras (incluido su IC) eran muy similares. Los gráficos de densidad también.
(En la búsqueda de la eliminación de valores atípicos, miré el rango de la muestra A y eliminé todos los puntos de muestra en B que caían fuera de él). Me gustaría que me dijeras dónde puedo encontrar algunos fundamentos de estimación robusta de medias que me permitan juzgar esta situación con más rigor. Y tener algunas referencias. No necesito un conocimiento muy profundo de diversas técnicas, más bien leer un estudio exhaustivo de la metodología de la estimación robusta.
He realizado una prueba t para determinar la significación de la diferencia de medias tras eliminar los valores atípicos y el valor p es de 0,0559 (t en torno a 1,9); para las muestras completas, la estadística t era de 4,5 aproximadamente. Pero esa no es realmente la cuestión, las medias pueden ser un poco diferentes, pero no deberían diferir en un 50-60% como se ha indicado anteriormente. Y no creo que lo hagan.