4 votos

Tamaño efectivo de la muestra de regresión ponderada

Yo estoy haciendo un básico de regresión lineal con un predictor con algunos de ponderación en R, por ejemplo,:

lm(response~explanatory, weights=w, data=mydata)

Los pesos son medidas de precisión de la variable de respuesta. Debido a que los pesos son muy sesgada, me parece que me siento muy pequeños los valores de p para el efecto de mi variable explicativa, pero realmente sólo es impulsado por un par de puntos. Muchos de los puntos en el modelo, no están haciendo mucho (es decir, tienen un peso pequeño) pero aún así contribuir a los grados de libertad. Hay una forma alternativa de calcular el denominador grados de libertad regresión ponderada?

3voto

Sean Hanley Puntos 2428

Estrictamente hablando, ponderados en función de regresión lineal sólo produce resultados válidos si los pesos son sin error. Eso no suena muy sorprendente, supongo, pero significa, entre otras cosas, que los pesos son conocidos a priori, es decir, no se estima a partir de los datos (o estimada a partir de los datos). Esto casi nunca es el caso en la práctica. Sin embargo, a menos que se tienen muy pocos datos, y los pesos son muy imprecisos, WLS tiende a realizar el bien.

Deduzco que usted está preocupado de que sus resultados son impulsados por sólo un par de puntos de datos. Esta es una razonable preocupación. Hay varias opciones para explorar esta posibilidad. Se dividen en dos categorías:

  1. Puede ejecutar el análisis de alternativas y ver si se obtienen resultados que son suficientemente similares. Dos alternativas de análisis que se destacan para mí son el uso de regresión robusta, y el uso de mínimos cuadrados no ponderados con sándwich de errores estándar. Pero que el análisis de alternativas que se use debe ser elegido sobre la base de la razón que usted necesita el WLS enfoque en este caso, así que los que puede no ser la mejor de las opciones en este caso. Voy a describir un gran número de análisis posibles en mi respuesta aquí: Alternativas a la ANOVA de una vía para heteroscedastic de datos.

  2. Usted podría simular las situaciones que te interesa y ver cómo se realizan. Probablemente desee simular de varios mundos posibles, incluyendo posibilidades donde los pesos fueron correctas e incorrectas, y donde la hipótesis nula verdadera o falsa.

Para el registro, para responder a su pregunta explícita directamente, no sé de formas alternativas para calcular los grados de libertad en WLS de regresión. Sin embargo, me pregunto si hay realmente puede ser de varias formas diferentes para calcular los grados de libertad que son todas válidas; sospecho que no como esto parece como una reductio ad absurdum.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X