Un compañero de trabajo es el análisis de algunos datos biológicos para su tesis doctoral con un poco desagradable Heterocedasticidad (figura de abajo). Ella es el análisis con un modelo mixto, pero todavía está teniendo problemas con los residuos.
Registro-la transformación de las variables de respuesta limpia las cosas y según los comentarios a esta pregunta, este parece ser el enfoque adecuado. Originalmente, sin embargo, se había pensado que había problemas en el uso de variables transformadas con los modelos mixtos. Resulta que la que había sido la interpretación errónea de una declaración en Littell & Milliken (2006) de SAS para Modelos Mixtos que se estaba señalando por qué no es apropiado para transformar el recuento de datos y, a continuación, analizar con un normal lineal modelo mixto (cita completa más abajo).
Un enfoque que también mejora los residuos fue el uso de un modelo lineal generalizado con distribución de Poisson. He leído que la distribución de Poisson puede ser utilizado para el modelado de datos continua (por ejemplo, como se menciona en este post), y las estadísticas de los paquetes permiten, pero no entiendo lo que está pasando cuando el modelo se ajuste.
Para el propósito de la comprensión de cómo los cálculos subyacentes, mis preguntas son: Cuando el ajuste de una distribución de Poisson con datos continuos, 1) ¿los datos redondeados al entero más cercano 2) ¿este resultado en la pérdida de información y 3) Cuando, si alguna vez, es adecuado utilizar un modelo de Poisson para datos continuos?
Littel & Milliken de 2006, página 529 "la transformación de la [cuenta] de datos puede ser contraproducente. Por ejemplo, una transformación que pueden distorsionar la distribución de la aleatorios modelo de efectos o la linealidad del modelo. Lo que es más importante, la transformación de los datos todavía deja abierta la posibilidad de negativa predijo que cuenta. En consecuencia, la inferencia a partir de un modelo mixto utilizando transformadas de datos es altamente sospechoso".