17 votos

"todos estos puntos de datos provienen de la misma distribución." Cómo probar?

Me siento como que he visto en este tema se discuten aquí antes, pero no he sido capaz de encontrar nada en específico. A continuación, de nuevo, tampoco estoy muy seguro de lo que va a buscar.

Tengo un unidimensional conjunto de datos ordenado. Mi hipótesis es que todos los puntos en el juego provienen de la misma distribución.

¿Cómo puedo probar esta hipótesis? Es razonable de la prueba en contra de una alternativa general de "las observaciones en este conjunto de datos se han extraído de dos distribuciones diferentes"?

Idealmente, me gustaría identificar los puntos que vienen de los "otros" de la distribución. Desde que mis datos están ordenados, podría salirse con la identificación de un punto de corte, después de que de alguna manera se prueba si es "válido" para cortar los datos?

Edit: como por Glen_b la respuesta, estaría interesado en ser estrictamente positivo, distribuciones unimodales. También me gustaría estar interesado en el caso especial de asumir una distribución y, a continuación, las pruebas para diferentes parámetros.

30voto

AdamSane Puntos 1825

Imaginar dos escenarios:

  1. los puntos de datos todos fueron extraídas de la misma distribución, que fue uniforme en (16,36)

  2. los puntos de datos se elaboró a partir de una mezcla 50-50 de dos poblaciones:

    una. población, que se forma como esta:

enter image description here

b. la población B, la forma como esta:

enter image description here

... de tal manera que la mezcla de las dos se ve exactamente como en el caso 1.

¿Cómo podrían ser contada aparte?

Cualquiera sea la forma que elija para dos poblaciones, no siempre va a ser una sola distribución de la población que tiene la misma forma. Este argumento demuestra claramente que para el general en caso de que usted simplemente no puede hacerlo. No hay manera posible de diferenciar.

Si se introduce la información acerca de las poblaciones (supuestos, efectivamente), entonces no puede ser a menudo formas de proceder*, pero el caso general, está muerto.

* por ejemplo, si se supone que las poblaciones son unimodales y suficientemente diferente significa que usted puede conseguir en algún lugar

0voto

Jack Wills Puntos 13

Obviamente, se necesita tener algo de teoría para hablar acerca de la distribución(s) y estado hipótesis a prueba. Algo que los grupos de sujetos en uno o más grupos, y algo que hace que las mediciones de poner aparte.

¿Cómo se puede llegar? Veo tres opciones:

  • Si usted ya sabe que a partir de su materia, a continuación, sólo tiene que traducir en el lenguaje de la hipótesis estadística
  • Trazar los gráficos y reconocer patrones a ser hipótesis para la prueba de
  • Venir para arriba con una lista de las distribuciones usted podría encajar y hacer una matemática experimento. Probabilística de la programación es la palabra clave aquí

El ejercicio, a continuación, vamos a llegar a la conclusión de que hay uno o más grupos representados en la muestra, o sólo uno. O no del grupo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X