tenemos $N$ diferentes $X_i$'s, pero ahora cada uno es teóricamente a partir de un Binomio($k$,$p_i$), con la constante $k$ entre todos los sorteos, y sabemos que cada una de las $p_i$ correspondiente a cada observación.
Creo que no estoy completamente seguro de que entiende la situación exacta aquí. ¿Tienes una pequeña muestra (incluso un hecho uno de la derecha de la estructura) que le permitirá de forma más clara y específicamente detalle de lo que en realidad está observando? Es cada 'dibujar' un solo número o un vector, por ejemplo?
Es lo que cada uno dibuje en un determinado $p_i$ es visto, y el $p_i$ son conocidos por separado, o sólo ver una especie de suma de variables aleatorias?
Si es independiente y el $p$'s son conocidos, entonces usted podría calcular el chi-cuadrado sobre cada componente y agregar. Su problema puede ser potencialmente pequeña espera cuenta, pero si se añade que muchos de los componentes de este va a ser un problema menor. La alternativa es simular la distribución en su particular combinaciones de cuenta y $p$s y así sucesivamente.
Un aparte: Su pregunta es algo relacionado con esta distribución:
http://en.wikipedia.org/wiki/Poisson_binomial_distribution
... pero donde tiene una de Bernoulli para cada componente, sino un binomio.
Hay una obvia de la analítica de la extensión de la prueba anterior para este caso? En este momento estoy simulando una nula distribución de chi-cuadrado de estadísticas de la conocida $p_i$'s y la prueba de eso.
Que parece bastante sensato para mí. Ustedes son la simulación de la distribución exacta de un estadístico de prueba que había de otra forma aproximada.
Si bien se puede aproximar con una chi-cuadrado con sólo la adición de los componentes individuales y su d.f., parece que su enfoque - si la simulación tamaño es lo suficientemente grande debería ser mejor.
Usted puede comprobar la exactitud de usar simplemente una chi-cuadrado bastante directamente, ya que tienen una simulación ya - basta comparar su distribución con el correspondiente de la chi-cuadrado, prestando especial atención a las regiones cerca de los tipos de nivel de significación usted está interesado en (probablemente no les importa mucho si se calcula un p-valor de 0,56 como 0,36 desde i7t no alterar ninguna de las decisiones, pero probablemente atención relativamente más si se calcula uno de 0.056 como 0.036, donde bien podría cambiar su decisión).