Para ampliar sobre Wayne excelente respuesta, ppml
utiliza un robusto (heterocedasticidad) varianza-covarianza de la matriz y también una muestra finita de ajuste a la matriz para reducir el sesgo.
Estos son muy similares a lo sandwich()
en el paquete del mismo nombre calcula en R. La única diferencia es cómo lo finito-muestra el ajuste se realiza. En la sandwich(...)
función, no finito-muestra el ajuste se hace por defecto, es decir, el sándwich se divide por 1/n donde n es el número de observaciones. Alternativamente, sandwich(..., adjust = TRUE)
puede utilizar la que se divide por 1/(n - k) donde k es el número de regresores. Stata, sin embargo, divide por 1/(n - 1).
He aquí cómo usted puede obtener R para que coincida con el programa Stata mediante el uso de una costumbre sándwich de varianza con un factor de ajuste de 1/(n-1):
. clear
. set more off
. capture ssc install rsource
. use, clear
. saveold ~/Desktop/mock, version(12) replace
(saving in Stata 12 format, which can be read by Stata 11 or 12)
file ~/Desktop/mock.dta saved
. rsource, terminator(XXX) rpath("/usr/local/bin/R") roptions("--vanilla")
Assumed R program path: "/usr/local/bin/R"
Loading required package: zoo
Attaching package: 'zoo'
The following objects are masked from 'package:base':
as.Date, as.Date.numeric
> library("foreign")
> library("sandwich")
> library("lmtest")
> mock<-read.dta("~/Desktop/mock.dta")
> glmm<-glm(formula=y ~ x + w, family=quasipoisson(link="log"),data=mock)
> sandwich1 <- function(object, ...) sandwich(object) * nobs(object) / (nobs(object) - 1)
> coeftest(glmm,vcov=sandwich1)
z test of coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 0.516969 0.098062 5.2718 1.351e-07 ***
x 0.125657 0.101591 1.2369 0.2161
w 0.013410 0.710752 0.0189 0.9849
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
End of R output
. ppml y x w
note: checking the existence of the estimates
Number of regressors excluded to ensure that the estimates exist: 0
Number of observations excluded: 0
note: starting ppml estimation
note: y has noninteger values
Iteration 1: deviance = 139.7855
Iteration 2: deviance = 137.7284
Iteration 3: deviance = 137.7222
Iteration 4: deviance = 137.7222
Number of parameters: 3
Number of observations: 100
Pseudo log-likelihood: -173.89764
R-squared: .01628639
Option strict is: off
| Robust
y | Coef. Std. Err. z P>|z| [95% Conf. Interval]
x | .1256565 .1015913 1.24 0.216 -.0734588 .3247718
w | .0134101 .7107518 0.02 0.985 -1.379638 1.406458
_cons | .5169689 .0980624 5.27 0.000 .3247702 .7091676
Aquí está el programa Stata/R código que genera el resultado anterior. Estoy usando rsource
a ejecutar R de Stata (y usted tendrá que ajustar el rpath()
abajo para que coincida con su configuración), pero que no es realmente necesario: usted puede simplemente ejecutar la rsource
parte de R.
glmm<-glm(formula=y ~ x + w, family=quasipoisson(link="log"),data=mock)
sandwich1 <- function(object, ...) sandwich(object) * nobs(object) / (nobs(object) - 1)
ppml y x w