Esta respuesta de las direcciones de la primera y la tercera viñeta puntos: el problema Es solucionable? Podemos enmarcarla en una manera convencional para permitir la búsqueda o de la aplicación de los métodos convencionales?
Para abordar la segunda cuestión que ayuda a iniciar la generalización de la situación, conservando las características especiales que pueden ser útiles para una solución. Vamos a comenzar con los datos en bruto. El experimento es una secuencia de ensayos. En cada prueba (a) un par de dados hecho rodar y (b) podemos registrar el resultado de cada dado (o no) y su color. Esto puede ser representado por dieciséis valores: cuatro posibilidades para cada uno de los cuatro pares de dados. Nosotros conocemos las probabilidades asociadas con cada conjunto de cuatro resultados: $1/6^2$ para los dos, $(5/6)^2$ para los dos no, y $(1/6)(5/6)$ para cada uno de los otros dos resultados.
Para resumir los datos, supongamos que el rojo y azul de los dados estaban echados $n_{rb}$ a veces, el rojo y el amarillo dados $n_{ry}$ tiempos, etc. Esto significa que hemos observado en los resultados de $n_{rb}$ independiente de lanza de la roja y azul, dados, etc. La suma de los rojo-azul lanza por tanto, es el resultado de una distribución multinomial con el parámetro count $n_{rb}$ y las probabilidades de $(1/6, 5/36, 5/36, 25/36)$. Del mismo modo que la suma de los rojo-amarillo lanza es independiente resultado de una distribución multinomial con el parámetro count $n_{ry}$ e la misma probabilidades; el verde-azul de la tira tiene en cuenta el parámetro $n_{gb}$, y el color verde-amarillo lanza tiene en cuenta el parámetro $n_{gy}$. Estos cuatro distribuciones, en este orden, describir colectivamente un $16$-variable de distribución.
Visualización puede ayudar, así que vamos a considerar un ejemplo. Aquí están algunos de los datos crudos con encabezados descriptivos:
Red-blue Red-yellow Green-blue Green-yellow
00 01 10 11 00 01 10 11 00 01 10 11 00 01 10 11
Red Green Blue Yellow k0 k1 k2 k3 k4 k5 k6 k7 k8 k9 kA kB kC kD kE kF
* * 1
* * 1
* * 1
* * 1
Las variables se denominan k0
través kF
: evidentemente son un maniquí de codificación para el $16$ resultados posibles. Los resultados son esquemáticamente se muestra en la segunda línea: "00" significa que ambos dados no eran uno, "01" significa que sólo la segunda morir (como se denomina en la primera línea) mostró un uno, etc. De forma redundante, estrellas indican que dos dados estaban echados: he mostrado sólo para ilustrar lo que está pasando. Por lo tanto, este conjunto de datos se describen cuatro ensayos: el primero, el rojo era el no 1 y el azul fue 1; en el segundo, el rojo y el azul eran no-1; en la tercera, verde y azul fueron ambos a 1; y en el cuarto, el verde fue de 1 y el amarillo era el no-1.
Una estadística suficiente para este experimento sería la suma de todas las filas de datos (tomando espacios en blanco para ser ceros): esta cuenta cada uno de los 16 tipos de resultados.
No observamos estos datos en bruto, a pesar de que: se condensa para nosotros. Específicamente,
- El recuento de casos donde R y B mostraron 1 es la suma de los
k3
de columna.
- El recuento de casos donde tanto el R e y mostró 1 es la suma de los
k7
columna..
- El recuento de los casos en que tanto G y B mostraron 1 es la suma de los
kB
de columna.
- El recuento de los casos en que tanto G y YB mostró 1 es la suma de los
kF
de columna.
- El recuento de casos donde sólo R mostró 1 es la suma de los
k2
y k6
columnas.
- El recuento de casos donde sólo G mostró 1 es la suma de los
kA
y kE
columnas.
- El recuento de casos donde sólo B mostró 1 es la suma de los
k1
y k9
columnas.
- El recuento de casos donde sólo Y mostró 1 es la suma de los
k5
y kd
columnas.
- El número de casos en los que no mueren mostró 1 es la suma de los
k0
, k4
, k8
y kC
columnas (pero esto no es revelado a nosotros).
Escrito $\mathbb{k}$ para la columna de la matriz de k
's (en el orden que se indica), esta información está muy bien escrito como una transformación lineal $\mathbb{A k}$ donde la matriz $\mathbb{A}$ es
$$\left(
\begin{array}{cccccccccccccccc}
0 & 0 & 0 & 1 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \\
0 & 0 & 0 & 0 & 0 & 0 & 0 & 1 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \\
0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 1 & 0 & 0 & 0 & 0 \\
0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 1 \\
0 & 0 & 1 & 0 & 0 & 0 & 1 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \\
0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 1 & 0 & 0 & 0 & 1 & 0 \\
0 & 0 & 1 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 1 & 0 & 0 & 0 & 0 & 0 \\
0 & 0 & 0 & 0 & 0 & 0 & 1 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 1 & 0
\end{array}
\right)$$
It is now immediate--your computer will happily tell you this--that the last four rows are redundant (the sum of rows 5 and 6 equals the sum of rows 7 and 8). We might just as well drop the last row from $\mathbb{A}$: será de rango completo.
Aquí, entonces, es el resumen de la declaración del problema:
Dada una realización $\mathbb{k}$ a partir de una familia de distribuciones multivariantes
parametrizado por los números naturales $\mathbb{n} = (n_{rb}, n_{ry}, n_{gb}, n_{gy})$
y dada una observación de $\mathbb{A k}$, la estimación de los parámetros
(y obtener los errores estándar o límites de confianza en las estimaciones).
Probablemente deberíamos añadir que las entradas de $\mathbb{k}$ son en sí mismos números naturales: este es un discreto distribución.
En general, la estructura de $\mathbb{A}$ induce dependencias entre las entradas de $\mathbb{A k}$. (Tenga en cuenta que las entradas de $\mathbb{k}$ ya de por sí tienen algunas pequeñas dependencias derivadas de la subyacente multinomial de las distribuciones). Esto, junto con la distribución discreta de $\mathbb{A k}$ y discreto del espacio de parámetros, se va a crear dificultades en el desarrollo de estimadores.
Al menos podemos empezar por tomar las expectativas, porque es fácil escribir la expectativa de $\mathbb{k}$ en términos de la $n_{*}$: $E[k_0] = n_{rb}25/36$, $E[k_1] = n_{rb}5/36$, ..., y $E[k_A] = n_{gy}/36$. La linealidad de la expectativa nos dice que $E[\mathbb{Ak}] = \mathbb{A}E[\mathbb{k}]$. De trabajo esto nos da una gran cantidad de posibles método de momentos estimadores (no sólo uno). (Uno de ellos fue publicado como una respuesta por parte de la OP.) Así que sí, el problema es solucionable. (La generalizada problema podría tener un método único-de-estimador de momentos o quizás ninguno en absoluto al $\mathbb{A}$ no proporciona la suficiente información para identificar todos los parámetros.)
Las preguntas importantes izquierda a resolver son:
Cómo bien puede ser resuelto? Se pueden encontrar buenas (por ejemplo, admisible) estimadores?
Podemos obtener un buen intervalos de confianza u otras expresiones de incertidumbre en las estimaciones?
Podemos seguir y calcular la varianza de estas observaciones mediante el uso de reglas estándar, el uso de los segundos momentos de la distribución multinomial. Con esto en la mano, uno podría estar tentado a combinar las siete observaciones (los condes de 1 a 7) el uso generalizado de los mínimos cuadrados. O, se puede proceder directamente a intentar un enfoque de máxima verosimilitud (pero esto sería muy difícil de calcular). Cuando los componentes de la $\mathbb{k}$ se espera que sea grande, normal aproximaciones a la distribución multinomial funcionará muy bien, para, a continuación, $\mathbb{A k}$ también será (aproximadamente) multivariante normal y máximo de estimaciones de probabilidad de la $n_{*}$ podría ser portado bien.
Esa es la (limitada) extensión de mi análisis. Quería compartir en este punto para dar algo para el futuro de respuestas para construir y mostrar la complejidad y las dificultades implicadas en este aparentemente simple de la situación.