Análisis exploratorio de datos (AED) a menudo conduce a explorar otras "pistas" que no necesariamente pertenecen a la primera serie de hipótesis. Me enfrento a una situación en el caso de los estudios con un tamaño limitado de la muestra y una gran cantidad de datos recogidos a través de diferentes cuestionarios (socio-demográficos de datos, neuropsicológicas o escalas de médicos-por ejemplo, mental o funcionamiento físico, depresión/ansiedad, los síntomas de la lista de verificación). Sucede que EDA ayuda a poner de relieve algunas relaciones inesperadas"inesperado" en el sentido de que no fueron incluidos en el análisis inicial del plan) que se traduce en más preguntas/hipótesis.
Como es el caso de sobreajuste, los datos de dragado o de espionaje conduce a resultados que no hay que generalizar. Sin embargo, cuando una gran cantidad de datos disponibles, es muy difícil (por el investigador o médico) para postular un conjunto limitado de hipótesis.
Me gustaría saber si hay bien reconoce los métodos, recomendaciones o reglas generales que pueden ayudar a delinear EDA en el caso de la pequeña muestra de los estudios.