5 votos

¿Cuáles son los métodos estadísticos para la comparación de los diferentes soportes

Yo no soy particularmente familiarizado con las estadísticas y estoy buscando métodos para el análisis de los números que se han roto en diferentes "entre paréntesis" o "grupos" para diferentes entidades.

Considerar tres empresas.

  • Un anuncia que tienen 10 fábricas de generación de entre 10.000 y 20.000 widgets por año y 15 fábricas de generación de entre 20.000 a 40.000

  • B anuncia que tienen 7 fábricas de generación de entre 15.000 y 25.000 widgets y 5 fábricas de generación de entre 25.000 y 35.000

  • C anuncia que tiene 5 fábricas de generación de entre 10.000 y 23.000 widgets y 14 entre 23,000 y 40.000

Para ser claros todos los widget de la producción se incluye en mi ejemplo simplificado de arriba.

¿Qué métodos estadísticos que se pueden utilizar (y existen) que permiten agregar estos datos y hacer predicciones generalizadas (todas las empresas tienen en promedio x fábricas que generan 15,000 widgets por año y y fábricas que generan 40,000)?

6voto

Christopher Woods Puntos 218

resumen: Si usted puede conseguir el número de widgets para cada fábrica que sólo puede utilizar la cuenta para hacer lo que quieres, si usted está atascado con el binned datos que usted está probablemente fuera de suerte. Los detalles a continuación.

Los recipientes (de 10.000 a 20.000 y 20.000 a 40.000) son diferentes anchos de que se va a hacer ningún tipo de comparación o de predicción muy difícil, ya que usted tiene que hacer algunas hipótesis acerca de cómo los datos son distribuidos dentro de cada bin. Parece como si usted sabe cómo muchas de las fábricas que se encuentran en cada bin, a continuación, usted (o alguien) debe saber cómo muchos de los widgets de cada fábrica produce lo contrario, ¿cómo son los números en el que poner en cada bin. Si usted tiene que los datos que usted podría utilizar simple cuenta a la hora de responder al tipo de preguntas que usted quería, especialmente desde entonces todos los widget de la producción está cubierto, por lo que incluso no tiene que preocuparse de error de muestreo.

Suponiendo que se oculta la información de como se me dijo que tendría hacer algunas suposiciones acerca de cómo las fábricas están distribuidos dentro de los contenedores, si se supone que están distribuidas de manera uniforme, entonces usted podría estimar cuántas fábricas sería mayor o menor que cualquier número especificado de widgets simplemente multiplicar el número de fábricas por parte de la proporción de la bandeja por encima (o por debajo) del número especificado de widgets. Pero esta suposición no suele funcionar muy bien ya que las bandejas son distintos en relación a la cantidad máxima total de los widgets, y el punto de quiebre se encuentra cerca del centro (a ver por qué este es el problema imaginar una distribución normal, imaginar su división en dos bandejas con el punto de equilibrio en el medio, las dos bandejas serán de la misma altura, es decir, que se va a ocultar el hecho de que la mayoría de las fábricas widget de producción es de cerca de media).

3voto

Nick Cox Puntos 22819

Tiene, como mínimo, los puntos en que la función de distribución acumulativa para cada uno, es decir, la frecuencia acumulada o la probabilidad acumulativa de las fábricas productoras de menos # widgets. Así que usted puede parcela de aquellos. Si cualquier empresa es muy diferente, se destacan. De lo contrario, usted no tiene suficiente información.

Personalmente prefiero invertir esto y pensar de los cuantiles de las funciones, pero se trata de la misma información.

De lo contrario, no hay ninguna magia blanca para restaurar detalle omitido en la producción de datos.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X