Generación de datos con un ratio de predefinidos

Question

Generación de datos con un ratio de predefinidos

Preguntado el 18 de Julio, 2011: Cuando se hizo la pregunta
547 visitas: Cuantas visitas ha tenido la pregunta
1 Respuestas: Cuantas respuestas ha tenido la pregunta
Abierta: Estado actual de la pregunta

Tengo que simular (en javascript) la probabilidad de que los miembros de una determinada población tendría una enfermedad, dado un valor contextual. Toda la información que tenemos proviene de los documentos que muestran los odds ratios con $95\%$ intervalo de confianza.

He encontrado Box-Muller método y otros enfoques para la distribución normal, pero no me doy cuenta de la forma de generar números aleatorios con O, CI porcentaje y el intervalo.

Preguntado el 18 de Julio, 2011 por SoaperGEM

Answer 1

1 Respuestas

Answer 2

4voto

Niall Puntos 51

Parece que estás preguntando cómo generar bivariado de datos binarios con un pre-especificado odds ratio. Aquí voy a describir cómo se puede hacer esto, como usted puede generar un discretas variables aleatorias (como se describe aquí), por ejemplo.

Si desea generar datos con un determinado odds ratio, estamos hablando de los binarios que viene de una $2 \times 2$ tabla, por lo que la distribución normal no es relevante. Deje $X,Y$ ser los dos resultados binarios; el $2 \times 2$ tabla puede ser parametrizado en términos de la célula probabilidades de $p_{ij} = P(Y = i, X = j)$ . Los parámetros de $p_{11}, p_{01}, p_{10}$ será suficiente, ya que $p_{00} = 1 - p_{11} - p_{01} - p_{10}$ .

Se puede demostrar que hay un 1-a-1 es invertible asignación de $\{ p_{11}, p_{01}, p_{10} \} \longrightarrow \{ M_{X}, M_{Y}, OR \}$ donde $M_{X} = p_{11} + p_{01}, M_{Y} = p_{11} + p_{10}$ son las probabilidades marginales y $OR$ es el odds ratio.

Es decir, podemos mapa de ida y vuelta entre el $\{$ celular probabilidades de $\}$ $\{$ las probabilidades marginales y Odds ratio $\}$ . El uso de este hecho, se puede generar bivariado de datos binarios con un pre-especificado odds ratio. Este resto de esta respuesta tendrá que caminar a través de ese proceso y el suministro de algunos crudo, R código para llevarlo a cabo

El ' $\longrightarrow$ ' es bastante simple; para generar datos con un determinado odds ratio usted tiene para invertir esta asignación. Para un valor fijo de $M_{X}, M_{Y}$ , tenemos

$\begin{equation} \log( OR ) = \log(p_{11}) + \log \left(1 - M_{Y} - M_{X} + p_{11}\right) - \log \left(M_{Y}-p_{11}\right) - \log \left(M_{X}-p_{11}\right). \end{equation}$

Es un hecho que

$\begin{equation} {\rm max}\Big(0, M_X + M_Y-1\Big) \le p_{11}\le {\rm min}\Big(M_X, M_Y\Big). \end{equation}$

Como $p_{11}$ se mueve a través de este rango, $OR$ aumenta monótonamente desde 0 a $\infty$ , por lo que existe una única raíz de

$\begin{equation} \log(p_{11}) + \log \left(1 - M_{Y} - M_{X} + p_{11}\right) - \log \left(M_{Y}-p_{11}\right) - \log \left(M_{X}-p_{11}\right) - \log(OR) \end{equation}$

como una función de la $p_{11}$ . Después de la resolución de esta raíz, $p_{10} = M_{Y} - p_{11}$ $p_{01} = M_{X} - p_{11}$ $p_{00} = 1 - p_{11} - p_{01} - p_{10}$ , punto en el cual tenemos la celda de probabilidades y el problema se reduce a simplemente generar discretas variables aleatorias.

El ancho del intervalo de confianza será una función de la cantidad de glóbulos rojos así que se necesita más información para, precisamente, reproducir los resultados.

Aquí hay algunos crudo, R código para generar los datos como se especifica anteriormente.

 # return a 2x2 table of n outcomes with row marginal prob M1, column marginal prob 
 # M2, and odds ratio OR
 f = function(n, M1, M2, OR)
 {
    # find p11
    g = function(p) log(p) + log(1-M1-M2+p) - log(M1-p) - log(M2-p) - log(OR)
    br = c( max(0,M1+M2-1), min(M1,M2) ) 
    p11 = uniroot(g, br)$root

    # fill in other cell probabilities
    p10 = M1 - p11
    p01 = M2 - p11
    p00 = 1-p11-p10-p01

    # generate random numbers with those cell probabilities
    x = runif(n)
    n11 = sum(x < p11)
    n10 = sum(x < (p11+p10)) - n11 
    n01 = sum(x < (p11+p10+p01)) - n11 - n10
    n00 = n - (n11+n10+n01)

    z = matrix(0,2,2)
    z[1,] = c(n11,n10)
    z[2,] = c(n01,n00)

    return(z)
}

Respondido el 18 de Julio, 2011 por Niall (51 Puntos )

Generación de datos con un ratio de predefinidos

Respuesta

Preguntas Destacadas

Etiquetas mas usadas

i-Ciencias.com

Powered by:

Generación de datos con un ratio de predefinidos

Respuesta

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

i-Ciencias.com

Powered by: