6 votos

Detener la regla para el control de calidad problema

Problema:

Supongamos que tengo un proceso de producción que los rendimientos de la producción en lotes de $n$ artículos. Para cada lote, puedo probar si son de buena o mala calidad. Deje $q_i\in\{1,0\}$ ser la calidad de la prueba elemento de $i$.

Si más de la mitad de los elementos son 'malos', el lote debe ser descartado. En otras palabras: el lote se deben desechar si la calidad promedio de los elementos de es $\bar{q}(n)<0.5$.

Supongamos que la prueba es secuencial (es decir, se aprende la calidad de los objetos de uno en uno), y cada prueba es un sorteo al azar de una distribución de Bernoulli con desconocidos media de $p$.

Me gustaría saber cuándo dejar de elementos de prueba en un proceso por lotes, con el fin de decidir si se descarta sin pruebas de todos los elementos, y sin embargo ser estadísticamente seguros de que el resultado (descartar vs no descartes) es la misma que la que se habría alcanzado si todos los artículos que habían sido probados.

Lo que tengo actualmente:

Si yo supiera $p$, podría utilizar una aproximación normal para estimar el intervalo de confianza de la proporción binomial $\bar{q}(k)$ cualquier $k$. Con esto, para cualquier ancho del intervalo, podría calcular el número de pruebas que se requieren para lograr un nivel de confianza dado (déjame llamar a dicho número de pruebas de $k^*$).

Ya no sé $p$, una opción sería la de resolver para $k^*$ suponiendo el peor de los casos (es decir,$p=0.5$). Esto fue propuesto (y discutido) en una pregunta relacionada aquí.

Sin embargo, este enfoque no toma en cuenta que el $n$ es finito, así que una vez que muchos artículos se han probado, es muy poco probable que una prueba más de swing el resultado...

4voto

dave Puntos 224

Enfoque Bayesiano

Las muestras de $(q_i)_{i=1..k}$ son tomadas secuencialmente (sin reemplazo) de un lote de tamaño $n$ para el propósito de hacer inferencias acerca de la $\bar{q}(n)$, la proporción desconocida de "buena" elementos del lote. Dos criterios se supone que:

  1. Un número real $acc\in(0,1)$ (por ejemplo,$acc=0.5$) que sirve para definir la "aceptabilidad" de un lote; específicamente, el lote se considera la onuaceptable iff $\bar{q}(n) < acc$.
  2. Un número real $\epsilon\in(0,1)$ (por ejemplo,$\epsilon=0.05$) que sirve como un "eficaz convergencia" criterio; específicamente, si una secuencia de probabilidades de $p_k$ se sabe que convergen a $0$ o $1$, que se considera que tienen "efectivamente convergente" a $0$ (resp. $1$) si $\ p_k \le \epsilon$ (resp. $\ p_k \ge 1-\epsilon$).

El muestreo se por lo tanto, detener al $p_k$, la probabilidad posterior de $\{\bar{q}(n)<acc\}$$(q_i)_{i=1..k}$, ha "efectivamente convergente" a $0$ o $1$ (como se debe hacer en caso de $k\in 1..n$, debido a que, necesariamente,$p_n\in\{0,1\}$). Por lo tanto, el procedimiento secuencial es la siguiente:

  1. $k \leftarrow 0$.

  2. $k \leftarrow k+1$; muestra de $q_k$, produciendo $(q_i)_{i=1..k}$.

  3. Calcular la distribución posterior de la desconocida $\bar{q}(n)$, determinado $(q_i)_{i=1..k}$.

  4. Calcular la probabilidad posterior $p_k = P\big(\bar{q}(n)< acc\mid (q_i)_{i=1..k}\big)$.

  5. Si $p_k \le \epsilon$, deciden $\{\bar{q}(n)\ge acc\}$; por el contrario, si $p_k \ge 1-\epsilon$, deciden $\{\bar{q}(n)< acc\}$; else goto (2).

Posterior distribución

Deje $S_k = \sum_{i=1}^k q_i = k\,\bar{q}(k)$$k\in 0..n$. Ahora

$$\begin{align} &P\{S_n\!=\!t\mid S_k\!=\!s\} \\ &= \int_0^1 P\{S_n\!=\!t\mid S_k\!=\!s, p\!=\!p'\}\,f_{p\mid S_k}(p'\mid s)\,dp'\tag{A1}\\ &= \int_0^1 P\{S_n\!=\!t\mid S_k\!=\!s, p\!=\!p'\}\,\frac{P\{S_k\!=\!s\mid p\!=\!p'\}f(p')}{\int_0^1 P\{S_k\!=\!s\mid p\!=\!p''\}f(p'')dp''}\,dp'\tag{A2}\\ \end{align} $$

where

$$\begin{align} &P\{S_n\!=\!t\mid S_k\!=\!s, p\!=\!p'\}= \binom{n-k}{t-s}(p')^{t-s}(1-p')^{n-k-(t-s)}I_{\{s,...,s+n-k\}}(t)\tag{B1}\\ &P\{S_k\!=\!s\mid p\!=\!p'\}= \binom{k}{s}(p')^s(1-p')^{k-s}I_{\{0,...,k\}}(s)\tag{B2}\\ \end{align} $$ y $f()$ es el previo de la densidad de $p$. Por el bien de modelado de varios potenciales antes de que los estados de conocimiento acerca de la $p$, se utiliza una distribución Beta con real positivo parámetros de $\alpha, \beta$ ($\alpha=\beta=1$producir una distribución uniforme): $$f(p') = \frac{1}{\mathrm{B}(\alpha,\beta)}(p')^{\alpha-1}(1-p')^{\beta-1}I_{(0,1)}(p')\etiqueta{B3} $$ donde $$\mathrm{B}(\alpha,\beta)= \int_0^1(p')^{\alpha-1}(1-p')^{\beta-1}\,\mathrm{d}p'=\dfrac{\Gamma(\alpha)\,\Gamma(\beta)}{\Gamma(\alpha+\beta)} . $$ Tenga en cuenta que (B1) describe el hecho de que, condicional a $S_k\!=\!s,\ p\!=\!p'$, $$S_n\,=\,S_k + \sum_{i=k+1}^n q_i\ \sim\ s + \text{Binomial}(n-k,p').$$ y que (B2) describe el hecho de que, condicional a $p\!=\!p'$, $$S_k\,\sim\,\text{Binomial}(k,p').$$

Substituting (B) into (A) and performing the integrations gives the posterior distribution in terms of a binomial coefficient and standard Beta functions, for any $s\0..k$ and $k\in 0..n$:

$$\begin{align} &P\{S_n\!=\!t\mid S_k\!=\!s\} = \binom{n-k}{t-s}\ \frac{\mathrm{B}(\alpha+t,\ \beta+n-t)}{\mathrm{B}(\alpha+s,\ \beta+k-s)}\ I_{\{s,...,s+n-k\}}(t).\tag{C1}\\ \end{align} $$

Finalmente,

$$\begin{align} p_k &= P\big(\bar{q}(n)<acc\mid (q_i)_{i=1..k}\big)\\ &= \sum_{t\ <\ acc\cdot n}P\{S_n\!=\!t\mid S_k\!=\!s\}.\tag{C2} \end{align} $$

NB: Cuando $k=0$,$P(S_n=t\mid S_0=0)$$p_0$, que son los de antes (antes de muestreo) de las probabilidades de $\{S_n=t\}$$\{\bar{q}(n)<acc\}$, respectivamente, que se derivan por completo de la $\text{Beta}(\alpha,\beta)$ antes asignado para el proceso de Bernoulli de parámetro $p$. (Extremadamente "informativo" de los priores puede resultar en $p_0$ efectivamente igual a $0$ o $1$, por tanto, de aceptar o rechazar el lote antes incluso de muestreo.)

Aplicación en SageMath

# pr(S_n = t | S_k = s)
def P(t,n,k,s,a,b): return binomial(n-k,t-s) * beta(a+t,b+n-t) / beta(a+s,b+k-s)

# pr(S_n < acc*n | S_k = s)
def Pun(acc,n,k,s,a,b): 
    tot = 0; accn = acc*n
    for t in [s..s+n-k]:
        if t < accn: tot += P(t,n,k,s,a,b)
    return tot    

# example 
n = 20; acc = 0.5
a = 1; b = 1

# display the posterior probabilities pr(S_n < acc*n | S_k = s)
for k in [0..n]:
    print "k=%3d:   " % k,
    for s in [0..k]:
        print "%.2f" % Pun(acc,n,k,s,a,b),
    print     

Ejemplo

Aquí una foto de las decisiones que se hizo en el caso de un no-informativa (uniforme) antes de $p$, tamaño de lote, $n=20$ criterios $acc=0.5,\ \epsilon=0.05$ (cálculos programados en Sage):

enter image description here

De Laplace de la "Regla de la Sucesión"

Tenga en cuenta que la actual Beta-Binomial modelo exhibe de Laplace de la "Regla de la Sucesión" como un caso especial de la ecuación (C1) (cambio $n\to n+1,\ k\to n$): $$P(S_{n+1}=s+1 \mediados de S_n=s) = \frac{s+\alpha}{n+\alpha+\beta}. $$

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X