Tengo dos uno de los conjuntos de datos es un conjunto de datos con los médicos en la que tengo los procedimientos que se han realizado en un hospital donde el número real de los procedimientos no es capturado por estos datos ya que se trata de una muestra. Vamos a llamar a este conjunto de datos-1
También tengo otro conjunto de datos que contiene el número real de los procedimientos de los hospitales en el primer conjunto de datos. Vamos a llamar a este conjunto de datos-2.
He aquí un ejemplo: Dice el Dr. Una ha realizado 250 unidades de procedimiento de x en el hospital 1 hospital y uno de ellos tiene un total de 1000 unidades de procedimiento de x para el año 2012 esta información es en el conjunto de datos-1.
Ahora en el conjunto de datos-2 encontramos que el hospital-1 en realidad había un total de 2000 unidades de procedimiento de x para el año 2012.
Mi pregunta es: 1) ¿Qué métodos puedo utilizar para encontrar o estimar el número real de unidades de procedimiento x realizado por el Dr. Una?
Ahora mi idea era la de tomar la proporción de la muestra así lo 250/1000 = .25 y que se multiplican por el año 2000 que decir que estimamos que el Dr. a cabo en realidad 500 unidades de procedimiento de x para el año 2012.
Problemas en mi mente surgen inmediatamente, aunque. Yo no creo que esta relación se mantenga en el espacio más grande. Es muy posible que el Dr. a cabo 251 unidades de procedimiento x o en el extremo de 1900 de ellos.
Debo señalar que la hay, por supuesto, a varios médicos en el dataset-1 así también pensé sobre el uso de intervalos de confianza.
Cualquier ayuda o comentario se agradece. Gracias de antemano.