La respuesta simple es la ponderación. Es decir, se puede usar pesas para estandarizar los grupos en la "aceptado" grupo de la población de interés. El problema que surge de la utilización de dicho pesos en un análisis agrupado utilizando tanto la primera y la segunda de 2 años de fases, se estima que entre el peso de la población y los parámetros son ahora dependientes. El pseudolikelihood enfoque se utiliza normalmente (en este caso, se trataría de algún tipo de pseudo-parcial probabilidad) donde usted ignorar la dependencia entre las ponderaciones muestrales y estimaciones de los parámetros. Sin embargo, en muchas circunstancias prácticas (y esto no es diferente), contabilidad para esta dependencia es necesaria. El tema de la creación de un estimador eficiente de los cocientes de riesgo es difícil, y hasta donde yo sé abierto. Este es vagamente similar a las dos de la fase de estudio y creo que podría ser esclarecedor consulte el siguiente artículo de Lumley y Breslow, libremente disponibles a través de los NIH
Mejora de Horvitz-Thompson Estimación de los Parámetros del Modelo de Dos fases Estratificado Muestras: Aplicaciones en Epidemiología.
El artículo analiza los métodos de encuesta, se aplica generalmente en la regresión logística, sin embargo, usted puede de peso en los datos de supervivencia así. Algunas consideraciones importantes que te olvidaste de mencionar es que si usted está interesado en la creación de una predicción que se aplica a la totalidad de la población, o a la "calificación" de la población a partir de los 2 años de cálculos, o la "calificación" de la población, basado en el modelo resultante. Usted también no menciona exactamente cómo una "predicción" del modelo se crea a partir de un modelo de Cox, como ajustar los valores de un modelo de Cox no puede ser interpretado como riesgos. Supongo que estimar los cocientes de riesgo, a continuación, obtener un alisado estimación de la función de riesgo de referencia.