Estoy ejecutando varios análisis filogenéticos por mínimos cuadrados en R, donde estoy tomando un conjunto de datos existentes para varias especies, y añadiendo dos nuevas especies para las que tengo datos. Quiero probar si la nueva regresión de todas las especies es significativamente diferente de la regresión anterior. Pero no estoy seguro de la prueba adecuada a utilizar.
El conjunto de datos existente establece una regresión que debería ser aplicable a todas las especies. Puedo añadir datos sobre dos especies, y lo que encuentro es que una de las dos especies cae más o menos en la regresión predicha por el conjunto de datos original. La otra especie cae muy por debajo de la regresión predicha por el conjunto de datos original. Así que supongo que lo que estoy tratando de determinar es si hay diferencias significativas tanto en la pendiente y el intercepto, así como diferencias significativas en la fuerza de la regresión.
0 votos
Hola @Nate y bienvenido al sitio. ¿Estoy en lo cierto al afirmar que la variable dependiente (resultado) es la misma en la regresión para todas las especies y en la regresión antigua? Para comprobar si el modelo con todas las especies supone una mejora con respecto a la regresión anterior, puede utilizar una prueba de cociente de probabilidades. Véase esta entrada para ver un ejemplo práctico en
R
.1 votos
¿Puede concretar en qué se diferencia la nueva regresión de la anterior? Por ejemplo, ¿se pregunta si la pendiente de la relación entre X e Y difiere según la especie, si difiere el intercepto o si difieren ambos? ¿O algo más?
0 votos
COOLSerdash, gracias por la ayuda, voy a trabajar a través de ese ejemplo y el código. @gung Lo siento, lo que estoy tratando de lograr es lo siguiente. El conjunto de datos existente establece una regresión que debería ser aplicable a todas las especies. Puedo añadir datos sobre dos especies, y lo que encuentro es que una de las dos especies cae más o menos en la regresión predicha por el conjunto de datos original. La otra especie cae muy por debajo de la regresión predicha por el conjunto de datos original. Así que supongo que lo que estoy tratando de determinar es si hay diferencias sig. tanto en la pendiente y el intercepto, al añadir los nuevos datos. Gracias.
0 votos
Existen dos enfoques generales. Uno (el enfoque más común, creo) es combinar en una sola regresión con variables ficticias para los diferentes conjuntos, que parece el enfoque que COOLSerdash está señalando). El otro es construir pruebas basadas en regresiones separadas; hay ventajas y desventajas en ambos casos. La primera requiere supuestos algo más restrictivos (como la igualdad de varianza), pero es más conveniente y debería -si los supuestos son ciertos- tener una potencia ligeramente superior.