5 votos

Simulación de datos con media, mínimo y máximo especificados

Estoy haciendo unas simulaciones y el cliente me ha dicho que una variable debe oscilar entre -20 y +65 con una media de 30. Evidentemente, no puede ser normal, pero debería tener una forma de campana aproximada.

Más adelante, tendré que simular datos con una media, un mínimo y un máximo algo diferentes.

¿Cuáles son las buenas maneras de hacerlo?

Estoy utilizando SAS pero también tengo acceso a R.

AÑADIR DETALLES: Este es el porcentaje de ataques epilépticos que no son reportados por el paciente. Estoy calculando cuánto afecta esto a la potencia en los ensayos.

1 votos

¿Qué hay que hacer con los datos? Mi opción por defecto para el muestreo con restricciones suele ser utilizar stan (Rstan), ya que normalmente también necesito realizar algún tipo de modelado con las muestras a lo largo del proceso... Para tu problema, puedes escribir el programa para que lea los mínimos y los límites como datos, así podrás usar el mismo programa una y otra vez.

3 votos

En algunos campos -especialmente en la gestión de proyectos y en todo lo que tocan los consultores empresariales con un conocimiento imperfecto de la modelización estadística- un distribución triangular se utiliza de forma rutinaria. Como seguro que sabes, la forma de la distribución debería estar determinada por qué que estás simulando. También podrías hacerle un favor a tu cliente incluyendo algunos valores fuera del rango, a menos que sean físicamente imposibles, porque la mayoría de la gente es demasiado conservadora en sus estimaciones de rango.

2 votos

¿Podría aclarar cómo los números que van desde $-20$ a $65$ podría ser proporciones de algo?

3voto

shyam Puntos 4133

A partir de whuber El comentario de la Sra. G., propongo un distribución triangular estrategia.

La media de la distribución triangular es:

$E[x] = \frac{a+b+c}{3}$

donde $a$ y $b$ son los límites superior e inferior del rango y $c \in [a,b]$ es el modo. Que $a=-25$ y $b=60$ implica que $c=55$ .

Según el Página de CRAN sobre distribuciones de probabilidad :

Distribución triangular/trapezoidal : paquetes triangle , mc2d , ExtDist y VGAM proporcionar d , p , q , r funciones para la distribución triangular.... Un generador aleatorio rápido está disponible para la distribución triangular se implementa [ sic ] en Runuran así como la función de densidad.

Por supuesto, se utilizaría el r dentro de cualquiera de estos u otros paquetes que decida utilizar.

Como alternativa a la distribución triangular, se puede considerar la distribución trapezoidal generalizada pero esto complicaría la elección de los valores de los parámetros porque hay un parámetro para cada vértice interior de la distribución.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X