1 votos

Regresión cuantil y tamaño de la muestra para un tau dado

Estoy realizando la regresión por cuantiles en R en un modelo no lineal (que se hace utilizando nlrq). Estoy obteniendo los coeficientes para los cuantiles deseados (tau = 0.05, 0.50, 0.95). Todo muy bien, pero correr el código sin razonamiento no es una buena práctica. Dado que determinamos cuantiles en los extremos, es decir, 0.05, 0.95 (pero también pueden ser más pequeños o más grandes... por ejemplo tau = 0.0001), los resultados de la regresión dependerán del número de puntos en la muestra de datos (además, los coeficientes serán más sensibles al valor inicial dado en la función nlrq). Mis preguntas son:

  1. ¿Existen reglas para determinar el número mínimo de muestras (tamaño de la muestra) necesario para realizar tales regresiones por cuantiles (me refiero entonces para cada posible tau (de 0.0001 a 0.999)?
  2. ¿Cómo determinamos el NIVEL de confianza de la regresión por cuantiles, por ejemplo, en 0.05? (Nivel, no intervalo... me refiero, si obtengo una línea de regresión para tau = 0.05 ¿cuál es su nivel de confianza? ¿O estoy pensando mal y debería buscar el intervalo/banda de confianza?.. Usé "intervalo-de-confianza" como etiqueta porque "nivel-de-confianza" no estaba permitido)

Si hay literatura con indicaciones, la leeré con gusto... si es posible con reglas prácticas sin teoremas complicados.

¡Muchas gracias a todos!

1voto

dan90266 Puntos 609

Esto sería fácil de simular pero sugiero investigar tamaños de muestra para los casos simples a los que la regresión de cuantiles se reduce cuando solo hay un predictor y ese predictor es categórico. Por ejemplo, para X binario balanceado con n/2 observaciones en cada valor de X, la regresión de cuantiles con τ=0.95 es lo mismo que calcular cuantiles de muestra estratificados por X. Existe literatura sobre los tamaños de muestra necesarios para los cuantiles de muestra, con un n más alto necesario para los cuantiles más extremos.

Para $\tau=0.5$ ver este que cuando se conoce la distribución de Y se puede invertir para resolver $n$ de manera que la mitad esperada del intervalo de confianza para la mediana cumpla con un nivel específico de precisión. Cuando la distribución de Y es desconocida, necesitarías muestras de esta distribución para estimar las estadísticas de orden necesarias para enchufar en la fórmula del intervalo de confianza. Probablemente hay fórmulas similares para $\tau \neq 0.5$.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X