4 votos

Determinar el número de observaciones en un conjunto de datos

Tengo dos uno de los conjuntos de datos es un conjunto de datos con los médicos en la que tengo los procedimientos que se han realizado en un hospital donde el número real de los procedimientos no es capturado por estos datos ya que se trata de una muestra. Vamos a llamar a este conjunto de datos-1

También tengo otro conjunto de datos que contiene el número real de los procedimientos de los hospitales en el primer conjunto de datos. Vamos a llamar a este conjunto de datos-2.

He aquí un ejemplo: Dice el Dr. Una ha realizado 250 unidades de procedimiento de x en el hospital 1 hospital y uno de ellos tiene un total de 1000 unidades de procedimiento de x para el año 2012 esta información es en el conjunto de datos-1.

Ahora en el conjunto de datos-2 encontramos que el hospital-1 en realidad había un total de 2000 unidades de procedimiento de x para el año 2012.

Mi pregunta es: 1) ¿Qué métodos puedo utilizar para encontrar o estimar el número real de unidades de procedimiento x realizado por el Dr. Una?

Ahora mi idea era la de tomar la proporción de la muestra así lo 250/1000 = .25 y que se multiplican por el año 2000 que decir que estimamos que el Dr. a cabo en realidad 500 unidades de procedimiento de x para el año 2012.

Problemas en mi mente surgen inmediatamente, aunque. Yo no creo que esta relación se mantenga en el espacio más grande. Es muy posible que el Dr. a cabo 251 unidades de procedimiento x o en el extremo de 1900 de ellos.

Debo señalar que la hay, por supuesto, a varios médicos en el dataset-1 así también pensé sobre el uso de intervalos de confianza.

Cualquier ayuda o comentario se agradece. Gracias de antemano.

2voto

Chris Puntos 806

¿Cómo son los datos en el conjunto de datos 1 muestreado el conjunto de todos los procedimientos? Si se muestra de manera uniforme al azar (por ejemplo, cada procedimiento tiene una oportunidad igual de ser incluido en el conjunto de datos 1) entonces se puede estimar el número real de los procedimientos mediante la realización de la escala lineal que propone. Si usted también quiere una medida de la incertidumbre en la estimación, se puede utilizar la distribución binomial negativa como he descrito en esta respuesta.

Si los procedimientos son muestreados no al azar (por ejemplo, algunos médicos son más propensos a tener los procedimientos en el conjunto de datos 1), entonces es muy poco lo que puede hacer sin necesidad de modelar explícitamente esto de alguna manera.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X