Soy nuevo en el concepto de umbralizar una matriz de varianza-covarianza y tengo problemas para entender el proceso exacto. Estoy siguiendo Bickel y Levina (2008) en la elección de un umbral duro. Lo que me preocupa es su ecuación número (3) para el operador de umbral:
Ts(M)=[mij1(|mij|≥s)]
Mi interpretación de esa ecuación es que la operación de umbralización se aplica a los elementos diagonales de la matriz M . Esto no tiene mucho sentido para mí. En una matriz de varianza-covarianza no estoy seguro de por qué querrías establecer cualquiera de las varianzas igual a cero.
Para ser explícito, mis preguntas son:
- ¿Se aplica el operador de umbralización a los elementos diagonales?
- Si sólo aplico el operador de umbralización a los elementos no diagonales, ¿resultará una mala estimación de la matriz de varianza-covarianza?
El contexto en el que surge mi problema es que estoy estimando un modelo probit con regresores endógenos a través del método generalizado de momentos siguiente Wilde (2008) . Tengo un gran número de regresores y algunos de ellos son variables indicadoras. Con algunas especificaciones del modelo, la matriz de varianza-covarianza es singular, lo que plantea un problema. Estoy abierto a cualquier solución, pero una solución que he leído es esta operación de umbralización.
Quiero mencionar que voy a agrupar la estimación de un modelo probit endógeno vía GMM en un paquete R. Apreciaría mucho cualquier ayuda para hacerlo robusto y útil para la comunidad estadística/econométrica.