Si el instrumento es débil, el sesgo del estimador IV puede ser grande y, en algunos casos, puede incluso ser mayor que el sesgo del estimador OLS. Con sus valores tabulados, Stock y Yogo fijan primero el mayor sesgo relativo del estimador de mínimos cuadrados de dos etapas (2SLS) con respecto a OLS que es aceptable. En este sentido, la prueba responde a la pregunta: ¿podemos rechazar la hipótesis nula de que el máximo sesgo relativo debido a instrumentos débiles es del 10% (o del 5%, etc.)?
Los valores críticos dependen entonces de este sesgo aceptable (un sesgo aceptable más bajo significa que su instrumento tiene que lograr un estadístico F de primera etapa más alto), el número de regresores endógenos y el número de restricciones de exclusión. Por ejemplo, si se fija el sesgo máximo aceptable en 0,05 (es decir, toleramos un sesgo del 5% en relación con el MCO), y se tiene una variable endógena y tres instrumentos, el valor crítico es 13,91, por lo que su instrumento no se considera débil si su estadístico F de la primera etapa es mayor que eso. El problema es que estos valores críticos sólo funcionan si se tienen al menos dos restricciones de sobreidentificación. En su caso, con una variable endógena, necesita al menos tres instrumentos.
Con una variable endógena la prueba de Cragg-Donald debería dar un resultado similar al de Stock y Yogo. Esta prueba difiere de la anterior si hay varias variables endógenas para las que tendrá múltiples primeras etapas. La prueba de correlación canónica de Anderson funciona de forma similar a la de Cragg-Donald, con la diferencia de que la CC de Anderson es una prueba de razón de verosimilitudes mientras que Cragg-Donald es un estadístico de Wald, pero ambas pruebas son aplicables con una variable endógena y un instrumento. Sin embargo, al final Stock Yogo, Cragg-Donald y Anderson se basan en un supuesto de iid en los errores. Si se utilizan errores estándar robustos a la heteroscedasticidad, por ejemplo, estas pruebas no funcionarán, pero la prueba de Kleinbergen-Paap es robusta frente a las violaciones del supuesto iid. También funciona con una variable endógena y un instrumento siempre que el modelo esté identificado. Hay una buena discusión sobre estas pruebas en estas notas de Baum (2007) . También se ofrecen otras pruebas robustas para instrumentos débiles en el programa de Stata rivtest
paquete.
Si el instrumento es débil, se puede utilizar la prueba de la razón de verosimilitud condicional mediante Moreira (2003) para realizar una inferencia robusta de instrumentos débiles. Un artículo de Andrews et al. (2008) muestra que la prueba CLR es aproximadamente óptima. Las regresiones con instrumentos robustos débiles están disponibles, por ejemplo, en el programa de Stata condivreg
paquete.