7 votos

Solución de fórmula para intervalos de confianza en dos proporciones

Estoy interesado en la comparación de dos proporciones independientes de dos muestras. La fórmula para hacerlo está disponible en la Internet (por ejemplo, aquí). Tan lejos, tan bueno.

Pero mi principal objetivo no es construir un intervalo de confianza. Más bien quiero para evaluar qué tan grande es el segundo proporción debe ser significativamente mayor que el de la primera parte (dado un nivel alfa y ambos tamaños de muestra).

Supongamos que he llevado a cabo un estudio y encontró que el 80% de 154 los encuestados utilizan el producto X. Supongamos, además, que voy a hacer un segundo estudio con las mismas preguntas y me voy para n=200 encuestados. Cómo de grande tiene esta segunda proporción, a ser signifcantly superior en un 90% de nivel alfa?

Alguien podría proporcionarme con la fórmula específica que es resuelto por la segunda proporción? Sé que hay calculadoras en línea o Poder para tales fines, pero por desgracia, tengo que construir tesis fórmula en Excel y por lo tanto hay que ponerlos en mi camino.

(Originalmente publicado en Stack Overflow, pero se le dijo que para las estadísticas, podría ser mejor con la publicación de mi pregunta aquí de nuevo, así que lo siento por crossposting!)

6voto

Silverfish Puntos 6909

Si va a crear un intervalo de confianza para la diferencia de dos proporciones, son los mejores procedimientos de la que usted está usando: usted podría considerar la posibilidad de hacer uso de la Wilson procedimiento. El artículo de la Wikipedia sobre el binomio intervalos de confianza menciona esto y varias otras posibilidades, pero no muestran que el método aplicado a las diferencias en las proporciones: para que, consultar una referencia, tales como Newcombe, Robert G., "Intervalo de Estimación para la Diferencia Entre Proporciones Independientes: Comparación de Once Métodos," la Estadística en Medicina, 17, 873-890 (1998).

Sin embargo parece que usted no desea crear un intervalo de confianza, sino más bien realizar una prueba de hipótesis. La fórmula que se desea utilizar es una versión arreglada de una determinada. Permítanme escribir $p_a$ $p_b$ para las proporciones en los grupos a y B, y sus tamaños de muestra como $m$ $n$ respectivamente. A continuación, su estadística de prueba es:

$$z = \frac{p_a - p_b}{\sqrt{\frac{p_a(1-p_a)}{m}+\frac{p_b(1-p_b)}{n}}}$$

Your result will be significant if this exceeds the upper critical value $z_\text{crit} = \Phi^{-1}(1 - \alpha/2)$ (where $\alpha$ is your significance level) or if it is below the lower critical value, which by symmetry of the normal distribution is $-z_\text{crit}$. If you were interested in a 90% confidence interval, note that this is equivalent to setting $\alpha$ as 10%, not as 90%! These two sides of significance correspond to whether the proportions differ because $p_a$ exceeds $p_b$ (positive $z$) or vice versa (negative $z$). If you are interested in the critical values for $p_a$ which make this just significant, then you need to solve this equation as equal to $\pm z_\text{crit}$. Although your question mentions only the uppper critical value I will write as if you are interested in both possibilities - partly because this corresponds better to what you mentioned about the upper and lower bounds of a 90% confidence interval, and partly because two-sided testing is usually a good idea in general. The upper limit you get by testing with $\alpha$ as 10% is equivalent to the one-sided test you'd get if you tested at 5%, so no great variation in the method is required.

If you feel daunted by the task of algebraic rearrangement, one option is to use a computer algebra system to do the work for you. One freely available, open source product is Sage (which is actually rather more powerful than just a CAS). Rearranging to make one variable the subject, is essentially the same as solving the equation for that variable in terms of the other variables. A brief tutorial on how to solve equations symbolically in Sage is here. This would then give you a formula you can set up in Excel.

A paid-for product is Mathematica, but many basic features of Mathematica are freely available online at Wolfram Alpha. Go there and type:

solve z=(a-b)/sqrt((a(1-a))/m + (b(1-b))/n) for a

The output will be:

Rearranged formula for binomial difference of proportions test

Here I have written $z_\text{crit}$ as $z$, $p_a$ as $a$ and $p_b$ as $b$ but I hope the meaning is still clear. Simply by changing $m$, $n$, $z$ and $b$ into appropriate cell references you can easily implement this formula in Excel. If cell A1 contains your level of signficance, $\alpha$, then then the cell you use for the critical $z$-score should contain the formula =NORM.S.INV(1-A1/2) so you should get the famous 1.96 (to two decimal places) if you set $\alpha$ at the 5% level, or 1.64 if you test at 10%.

Note that we actually find two solutions arise, corresponding to the two critical values for $a$, without having to check solve -z=(a-b)/sqrt((a(1-a))/m + (b(1-b))/n) for a for the case with negative $z$. It is clear that the first line of the rearrangement is must be:

$$z_\text{crit}^2 = \frac{(p_a - p_b)^2}{\frac{p_a(1-p_a)}{m}+\frac{p_b(1-p_b)}{n}}$$

Beyond this point it no longer matters whether we used the positive or negative value for $z_\text{crit}$. It's not so hard to see where Mathematica derives it solution from. Multiply by the denominator and we obtain:

$$z_\text{crit}^2 \left(\frac{p_a(1-p_a)}{m}+\frac{p_b(1-p_b)}{n}\right)= (p_a - p_b)^2$$

Then multiply by $mn$:

$$z_\text{crit}^2 \left(np_a(1-p_a) + mp_b(1-p_b)\right)= mn(p_a - p_b)^2$$

Once the brackets are multiplied out and terms are collected together, this will be a quadratic in $p_a$. La forma de Mathematica soluciones eran las dos raíces de la fórmula cuadrática , pero es más fácil lidiar con la simplificación!

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X