Processing math: 100%

7 votos

Intervalo de probabilidad para la distribución gamma

Hay algo que estoy haciendo mal en el siguiente ejercicio y agradecería que me ayudaran a resolverlo.

Sea X1,X2,,X5 sea una muestra aleatoria de un Γ(3,3) distribución . Defina W=5i=1Xi .

  1. Obtener la distribución de W y de 2W/3

  2. Encuentre c1 y c2 tal que P(c1<W<c2)=0.95


Desde W es la suma de variables gamma iid, WΓ(15,3) y ahora un argumento de transformación directo muestra que Y=23Wχ2(30) . Esto completa la pregunta 1.

Ahora, para la pregunta 2, pensé en transformar estas probabilidades utilizando el resultado de la pregunta 1, es decir, que 23Wχ2(30) . Por lo tanto, a menos que haya cometido un error horrible aquí:

P(23c1<Y<23c2)=0.95

Podemos encontrar las constantes de una tabla chisquare para 30 grados de libertad. En mi caso, son 16.791 para el límite inferior y 46.979 para la superior.

Entonces, si equiparamos 23c1=16.791 y resolver para c1 deberíamos ser capaces de encontrar la constante para el intervalo de confianza gamma anterior, ¿verdad?

El problema es que, según R , P(W<c1)=1 en lugar de la deseada 0.025 lo que significa que me he equivocado en alguna parte. Sin embargo, no creo que esté en cuestión 1 ya que he comprobado el resultado muchas veces.

Gracias, señor.

9voto

AdamSane Puntos 1825

Tu álgebra parece que está bien.

No das suficiente información para adivinar cómo decidiste " según R , P(W<c1)=1 en lugar de la deseada 0.025 ".

Este es un problema común con la distribución gamma - hay dos parametrizaciones comunes diferentes, ambas razonablemente extendidas, y si no tenemos cuidado, podemos pensar que estamos tratando con una cuando en realidad estamos haciendo la otra. (En realidad, hay una tercera paramaterización que aparece mucho cuando se trata de GLM gamma, la parametrización forma-media, pero esa suele ser más obvia cuando ocurre).

Wikipedia ( enlace permanente a la versión de hoy ) da ambas formas, véase la columna de la derecha. Confusamente, intercambia el papel de lo que yo veo como los nombres de parámetros más convencionales (en mi opinión β es más a menudo la escala, θ es más a menudo la tasa).

[Aunque es un tema que se plantea a menudo cuando se trata de software, no se trata sólo de un problema de software, ya que a menudo también se da entre humanos].

Resulta que R es un particular culpable de este tipo de problemas, la ayuda para la colección de funciones de distribución gamma parece hacer todo lo posible por enturbiar las cosas (en el momento de escribir estas líneas estoy utilizando la versión 3.0.2, pero el problema existe desde hace años).

Mi suposición es que usted podría estar llamando a la pgamma en R con argumentos sin nombre, pero suministrando argumentos de forma y escala, así ...

 pgamma(16.791*3/2,15,3)
[1] 1

... cuando R utiliza por defecto argumentos de forma y tasa.

En caso de duda, dibujar . Esto es lo que quieres calcular:

gamma shape=15, scale=3

Como veis, la proporción a la izquierda de 3216.791 (alrededor de 25) parece más o menos correcto.

Aquí está la densidad real con la que sospecho que estás calculando:

plot(x,dgamma(x,15,3),col=3,type="l")

gamma shape=15, rate=3

En este caso, la proporción a la izquierda de 3216.791 será muy cercano a 1.

Lamentablemente, la ayuda de R no es muy clara, e incluso induce a error. La frase bajo "Descripción" implica que los parámetros suministrados son forma y escala -- y la descripción de rate en "Argumentos" confirma la impresión (!) -- pero la lista de argumentos en la función en sí no es ambigua, si no obvia para un usuario novato:

pgamma(q, shape, rate = 1, scale = 1/rate, lower.tail = TRUE, log.p = FALSE)

¿Ves cómo el scale es, por defecto, una función de lo que se especifique en el campo rate ? Si sólo proporciona dos argumentos sin nombre después de la función q son la forma y la tasa, y luego la escala se obtiene tomando los recíprocos.

Es decir, necesitas usar un argumento con nombre para conseguir lo que quieres:

 pgamma(16.791*3/2,15,scale=3)
[1] 0.02500255

Cuando haya alguna posibilidad de duda, probablemente deba nombrar sus argumentos de todos modos, para hacerlos explícitos a los lectores humanos.

0 votos

Sí exactamente, he utilizado la función pgamma(16,791 *3/2, 15,3). Gracias por la aclaración.

1 votos

+1 Esta respuesta contiene muchos buenos consejos para trabajar con funciones estadísticas en cualquier plataforma.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X