Esto parece tan elemental, pero siempre me bloqueo en este punto
La mayoría de los datos que trato son no normales, y la mayoría de los análisis se basan en una estructura GLM. Para mi análisis actual, tengo una variable de respuesta que es la "velocidad al caminar" (metros/minuto). Me resulta fácil identificar que no puedo utilizar OLS, pero entonces, ¡tengo una gran incertidumbre a la hora de decidir qué familia (Gamma, Weibull, etc.) es la adecuada!
Utilizo Stata y miro los diagnósticos como los residuos y la heteroscedasticidad, los residuos frente a los valores ajustados, etc.
Soy consciente de que los datos de recuento pueden adoptar la forma de una tasa (por ejemplo, las tasas de incidencia) y he utilizado la gamma (el análogo a los modelos binomiales negativos discretos sobredispersos), pero me gustaría tener una "pistola humeante" que dijera SÍ, TIENES LA FAMILIA CORRECTA. ¿Es la única y mejor manera de hacerlo el mirar los residuos estandarizados frente a los valores ajustados? Me gustaría utilizar un modelo mixto para tener en cuenta alguna jerarquía en los datos, pero primero tengo que determinar qué familia describe mejor mi variable de respuesta.
Se agradece cualquier ayuda. Se agradece especialmente el lenguaje Stata.