En Econometría, diríamos que la no normalidad viola las condiciones del Modelo de Regresión Lineal Normal Clásico, mientras que la heteroscedasticidad viola tanto las hipótesis del CNLR como las del Modelo de Regresión Lineal Clásico.
Pero los que dicen "...viola OLS" también están justificados: el nombre Ordinario Los mínimos cuadrados proceden directamente de Gauss y se refieren esencialmente a normal errores. En otras palabras, "MCO" no es un acrónimo de la estimación por mínimos cuadrados (que es un principio y un enfoque mucho más general), sino de la CNLR.
Vale, esto era historia, terminología y semántica. Entiendo el núcleo de la pregunta del OP de la siguiente manera: "¿Por qué debemos hacer hincapié en el ideal, si hemos encontrado soluciones para el caso en que no está presente?" (Porque los supuestos de la CNLR son son ideales, en el sentido de que proporcionan excelentes propiedades de estimación por mínimos cuadrados "off-the-shelf", y sin necesidad de recurrir a resultados asintóticos. Recuerde también que MCO es de máxima verosimilitud cuando los errores son normales).
Como ideal, es un buen punto de partida enseñanza . Esto es lo que hacemos siempre al enseñar cualquier tipo de materia: Las situaciones "simples" son situaciones "ideales", libres de las complejidades que uno se va a encontrar realmente en la vida real y en la investigación real, y para las que no existen soluciones definitivas .
Y esto es lo que me parece problemático del post del OP: escribe sobre errores estándar robustos y bootstrap como si fueran "alternativas superiores", o soluciones infalibles a la falta de dichos supuestos en discusión para los que además el OP escribe
" suposiciones que la gente no tiene por qué cumplir"
¿Por qué? Porque hay algunos métodos para hacer frente a la situación, métodos que tienen cierta validez, por supuesto, pero que distan mucho de ser ideales? Los errores estándar de Bootstrap y de heteroscedasticidad robusta no son el si lo fueran, se habrían convertido en el paradigma dominante, enviando al CLR y al CNLR a los libros de historia. Pero no es así.
Así que partimos de la base de que garantiza aquellas propiedades de los estimadores que hemos considerado importantes (otra discusión es si las propiedades designadas como deseables son realmente las que deberían ser), de forma que tengamos visible que cualquier violación de las mismas, tiene consecuencias que no pueden ser compensadas totalmente a través de los métodos que hemos encontrado para tratar la ausencia de estos supuestos. Sería realmente peligroso, desde el punto de vista científico, transmitir la sensación de que "podemos llegar a la verdad de las cosas", porque, sencillamente, no podemos.
Por lo tanto, permanecen soluciones imperfectas a un problema no una forma alternativa y/o definitivamente superior de hacer las cosas. Por lo tanto, primero tenemos que enseñar la situación sin problemas, luego señalar los posibles problemas y, por último, debatir las posibles soluciones. De lo contrario, elevaríamos estas soluciones a un estatus que realmente no tienen.
2 votos
Parece ser una cuestión disciplinaria. En mi experiencia, en los extremos, los textos de Econometría casi siempre cubren qué inferencias compra cada supuesto y los textos de Psicología nunca parecen mencionar nada sobre el tema.
12 votos
Sin embargo, la homocedasticidad es necesaria para que OLS sea AZUL.
4 votos
Creo que tiene razón, esas suposiciones reciben una atención indebida. El incumplimiento de la normalidad o la homocedasticidad condicional no es tan perjudicial para los objetivos inferenciales de la mayoría de los profesionales como la endogeneidad y las formas funcionales mal especificadas.
2 votos
@CloseToC este es un punto muy bueno. A menudo nos preocupamos tanto por los tecnicismos estadísticos del modelo de regresión que olvidamos el panorama general... ¿está mi modelo correctamente especificado y es exógeno? Esto debe ser enfatizado repetidamente como una de las principales preguntas que uno debe hacerse a sí mismo al crear cualquier modelo.