En pocas palabras: ¿Existen diferencias entre los enfoques bayesiano y frecuentista del análisis exploratorio de datos?
No conozco ningún sesgo inherente a los métodos EDA, ya que un histograma es un histograma, un diagrama de dispersión es un diagrama de dispersión, etc., ni he encontrado ejemplos de diferencias en la forma de enseñar o presentar EDA (ignorando un artículo especialmente teórico de A. Gelman). Por último, he mirado en CRAN, el árbitro de todas las cosas aplicadas: No he encontrado paquetes adaptados a un enfoque bayesiano. Sin embargo, pensé que en CV podría haber algunas personas que pudieran arrojar luz sobre esto.
¿Por qué debería haber diferencias?
Para empezar:
- A la hora de identificar las distribuciones a priori adecuadas, ¿no se debería investigar esto visualmente?
- A la hora de resumir los datos y sugerir si utilizar un modelo frecuentista o bayesiano, ¿no debería el AED sugerir qué dirección tomar?
- Los dos enfoques tienen diferencias muy claras sobre cómo manejar los modelos de mezcla. Identificar que una muestra procede probablemente de una mezcla de poblaciones es un reto y está directamente relacionado con la metodología utilizada para estimar los parámetros de la mezcla.
- Ambos enfoques incorporan modelos estocásticos y la selección del modelo depende de la comprensión de los datos. Los datos más complejos o los modelos más complejos requieren más tiempo en EDA. Con estas distinciones entre los modelos estocásticos o los procesos de generación, hay diferencias en las actividades de EDA, así que ¿no debería haber distinciones derivadas de los diferentes enfoques estocásticos?
Nota 1: No me preocupan las filosofías de ninguno de los dos "bandos", sólo quiero resolver las carencias de mi conjunto de herramientas y métodos EDA.