En JMP Multivariate Methods, El REML se utiliza para estimar la correlación cuando hay valores de datos que faltan (pág. 28). Sin embargo, no hay documentación que describa cómo se hace.
Estoy tratando de comparar mis resultados en R con mis resultados en JMP. Sin embargo, en R, no conozco una forma de calcular la correlación o la covarianza cuando hay NAs (sin eliminar la fila con el valor NA). En JMP parece que no eliminan la fila, por lo que JMP incluye de alguna manera los datos en la estimación de la correlación y la covarianza. ¿Hay alguna manera de replicar los resultados de JMP en R? Aquí hay un conjunto de datos de ejemplo:
Var1 Var2
0.0079 0.0046
0.0136 0.0080
0.0270 0.0108
0.0287 0.0263
0.0325 0.0400
0.0228 0.0163
0.0015 0.0014
0.1198 0.0869
0.0054 0.0046
En R:
# No NAs
df <- data.frame("Var1" = c(0.0079, 0.0136, 0.0270, 0.0287, 0.0325, 0.0228, 0.0015, 0.1198, 0.0054),
"Var2" = c(0.0046, 0.0080, 0.0108, 0.0263, 0.0400, 0.0163, 0.0014, 0.0869, 0.0046))
df_cor <- cor(df$Var1, df$Var2) # result: 0.9685043
# With NA in first row
df_withNA <- data.frame("Var1" = c(0.0079, 0.0136, 0.0270, 0.0287, 0.0325, 0.0228, 0.0015, 0.1198, 0.0054),
"Var2" = c(NA, 0.0080, 0.0108, 0.0263, 0.0400, 0.0163, 0.0014, 0.0869, 0.0046))
df_withNA_cor <- cor(df_withNA$Var1, df_withNA$Var2) # result: NA
# Drop row with NA
df_dropNA_cor <- cor(df_withNA$Var1, df_withNA$Var2, use = "pairwise.complete.obs")
# result: 0.9670248
Aquí está la salida en JMP donde utilizan REML para estimar la correlación cuando el primer valor de Var1 está vacío (equivalente a NA):
# JMP Correlation between Var1 and Var2 with missing value: 0.9646
¿Alguien puede explicarme cómo se calcula el valor de JMP cuando falta un valor? ¿Hay alguna forma de calcular la correlación en R cuando hay valores perdidos?