5 votos

La importancia en la regresión simple, pero no de regresión múltiple

Antecedentes: estoy tratando de mostrar un aumento en el número de variables a lo largo de time, por lo que inicialmente me corrió una regresión lineal simple. Sin embargo, me crea un subconjunto de los datos, de modo que pudiera tener una regresión a estimar para cada species y reef combinación (que indican el cambio por año).

La totalidad de la regresión sería algo como

lm(Density ~ Time, data=data, subset=ReefSpecies=="ReefSpecies1).

A continuación se muestra la salida para Density una de las variables de respuesta, donde Little Grecian, etc = Reef y O. annularis, etc = Species. Hay 3 principales y 2 marginalmente significativa ReefSpecies con time. La segunda columna es el estimate, la tercera columna es el F-value, y la última columna es el p-value.

enter image description here

Por supuesto, yo estaba feliz con el resultado, pero yo también quería hacer un modelo lineal para ver lo que es la contabilidad de este aumento/disminución/ningún cambio en mi respuesta variables.

El modelo lineal se ve algo como esto: lm(Density ~ Species + I(Chl_zoox^0.25) + Season + TN + Biomass + Turbidity + FvFm + Time, data=Seasonal) y el resultado indica que time es poco significativo.

enter image description here

Último, me dijeron que si me corrió una regresión con un 3-way interacción de Reef*Species*Time (por ejemplo lm(Density ~ I(Chl_zoox^0.25) + Season + TN + Biomass + Turbidity + FvFm + Species*Reef*Time, data=Seasonal)) que iba a obtener teóricamente obtener el mismo estimaciones de la regresión lineal simple (lm(Density ~ Time, data=data, subset=ReefSpecies=="ReefSpecies1)). Claramente, este no es el caso, y yo recibimos NA para algunos de los de salida.

enter image description here

Pregunta:

1. Por qué hay una diferencia entre el significado de la regresión múltiple y la regresión simple?

Desde mi entender, la regresión múltiple tiene más poder y, por tanto, debe ser importante.

2. Creo que podría ser la interpretación de las interacciones de forma incorrecta, pero parece que los estimados en la regresión simple no son iguales (pero cerca) de la regresión múltiple de las estimaciones (e.g - Jaap - O. faveolata = -0.2504 en la regresión simple, pero en la regresión múltiple 0.001487 + 0.092568 + 0.559377 - 0.818717 = -0.1652).

¿Cómo puedo interpretar esta interacción para obtener valores similares? Y ¿por qué no ser significativo?

3. ¿Cuál es el trato con NA , en la interacción de salida? Qué tiene que ver esto con la multicolinealidad?

10voto

EdM Puntos 5716

En primer lugar, de regresión múltiple no necesariamente tienen más poder, especialmente cuando hay tantos términos de interacción como se ha especificado. Cada variable adicional, por cada nivel del factor, y cada interacción, se utiliza grados de libertad, por lo que puede disminuir su capacidad para detectar una diferencia verdadera si el extra de variables/niveles de los factores e interacciones no están relacionados con su variable de resultado.

Segundo, su deseo de que coincida con los resultados de la regresión simple a una combinación de los coeficientes de regresión múltiple sufre el mismo tipo de problema que tuvo en su deseo de comparar intercepciones en contra del grupo de medios en un análisis anterior intento. Si usted no tiene una perfectamente equilibrada de diseño con el mismo número de casos en cada grupo, entonces, no hay ninguna garantía de que se puede coincidir con los valores de esta manera.

Tercero, sus datos de resumen muestra que no hay O.franksi en cualquier ambientes de arrecifes, excepto para los lagartos. Así que no hay manera de obtener los coeficientes que incluyen las interacciones de O.franksi con Reef; usted no tiene los datos en 3 de los 4 Reef entornos. Por lo tanto los valores de NA.

Parece que han hecho un montón de trabajo para recopilar estos datos. Dada la naturaleza de estos datos, usted está probablemente en algún tipo de institución académica donde habría seguramente local de conocimientos estadísticos. Tan divertido como lo es para mí, para responder preguntas sobre este sitio, podría ser mejor para usted para identificar y empezar a trabajar con alguien cercano que puede ir sobre los detalles de sus datos a cerca de la mano y lo ayuda a analizar de la mejor manera, para llegar a las preguntas científicas que están pidiendo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X