Yo personalmente creo que esto es una mala idea. Si usted sabe que sus datos proceden de una cierta distribución, probablemente se puede decir algo con sentido. Usted puede tener 0/1 respuestas, por lo que la distribución binomial, puede estar condicionado a algunas otras covariables, esa es una de regresión logística. Usted puede tener cuenta, por lo que la distribución de Poisson, puede estar condicionado a algunas otras covariables -- que es de Poisson o cero inflado de Poisson o binomial negativa de regresión. Sin embargo, en general, mirando a hurtadillas y los datos y tratando de determinar la distribución rara vez conduce a buenos resultados.
Nos dice lo que su objetivo final de análisis puede ayudar a sugerir algunos de los mejores itinerarios. ¿Quieres simular nuevos datos a partir de una distribución similar? ¿Desea proporcionar un resumen analítico que es fácil de calcular para ciertas distribuciones? (He visto gente ajuste logarítmico-normal de la curva a los datos de ingresos, así como para informar sobre el coeficiente de Gini.) ¿Quieres comparar sus resultados con los de otra persona?
También, tenga en cuenta que una pequeña muestra (es decir por debajo de 100) será compatible con muchos posibles distribuciones. Una distribución con valores positivos sólo puede ser representada por una gamma, o un lognormal, o de una versión beta, o por Pearson de la familia, y simplemente no hay manera de distinguir entre ellos sobre la base de los datos solamente. Por otro lado, muestras grandes (digamos más de 10000) no es compatible con nada, ya que la vida real es más rica que la hipótesis que nos hacen sobre ella.