Hay una variedad de medidas de uniformidad de las sumas (valores de grupo). Por ejemplo, una alternativa es intentar minimizar la diferencia entre la suma mayor y la menor.
Minimizar la desviación estándar es lo mismo que minimizar la varianza.
Sin embargo, la media de las sumas es fija, por lo que minimizar la varianza es lo mismo que minimizar la suma de los cuadrados de los valores de los grupos .
Esto se acerca un poco más a un problema de optimización "estándar".
Está algo relacionado con el Problema de programación de un taller de trabajo y una serie de otros problemas.
Hay varios programas de programación de trabajos, algunos de los cuales podrían funcionar en tu problema, pero normalmente tienden a centrarse en minimizar el tiempo máximo de finalización (que correspondería a minimizar el conjunto más grande, lo que puede no darte una buena solución).
De un vistazo rápido parece que el partitions
en R puede generar particiones por ti - pero desafortunadamente el número de posibles particiones va a ser enorme en tu caso, así que tendrás que conformarte con algún algoritmo aproximado (de forma similar a algunos de los problemas de bin-packing, por ejemplo). [Los algoritmos aproximados pueden generar a menudo muy buenas soluciones].
Puede haber algún valor en esto:
http://www.colorado.edu/education/DMP/fair_division.html
pero parece que se fija sobre todo en las soluciones de licitación.
Si tiene un problema mixto (es decir, que incluye activos divisibles como el efectivo), su trabajo debería ser más fácil.
Se podría decir que hay que empezar con alguna solución razonable y utilizar, por ejemplo, la búsqueda tabú o el recocido simulado o algo así para intentar mejorarla.
Si se trata de un problema puntual, ¿puedes publicar algunos números proporcionales a los valores (no afectará en nada multiplicarlos por alguna constante arbitraria como 1,375)?
0 votos
Creo que se trata de un problema puramente matemático (de optimización) más que estadístico y, como tal, probablemente pertenezca a math.SE en lugar de aquí. Si puedes hacerlo estadístico (ver la cobertura de stats.SE en el FAQ), entonces podría encajar aquí. Si quieres moverlo, puedes marcarlo y un moderador lo cambiará por ti.
0 votos
(Pero, por favor, no hagas cross-post)
0 votos
¿Quiere decir numéricamente por igual, o tanto numéricamente como en cuanto al número de elementos? Lo pregunto porque si el número de elementos en cada grupo está limitado sólo entre 1 y 19 parece que el espacio en el que optimizar es algo enorme.
1 votos
No sé Glen_b, parece que sólo en la identificación del número de estados posibles (excluyendo los grupos que son esencialmente alias entre sí) que es una especie de precursor para el desarrollo de un métodos de optimización es en sí mismo un problema relativamente complejo digno de consideración CV.
0 votos
+1 @drknexus No estoy seguro de que la "complejidad" en sí misma sea suficiente para que sea un tema, pero estoy dispuesto a considerar que es un tema si hay un tema en el que encaja. Creo que es un problema muy interesante, como mínimo. En SO o en math.SE es probable que haya más gente que haya tratado problemas similares antes, así que también puede ser mejor para el OP.
0 votos
¿aprendizaje automático (optimización), estadística matemática (teoría de la probabilidad), informática estadística o basada en datos (optimización computacional)?
1 votos
@drnexus gracias por tu comentario. me refiero en términos de "pesos" o "valores de los elementos", no en términos de número de elementos. así, en la solución óptima, el grupo 1 podría tener un solo elemento de valor suficiente, mientras que los otros 7 grupos tienen cada uno, digamos, 3.
0 votos
¿Podría explicar con más detalle qué es exactamente una "desviación estándar de las sumas de los valores de los elementos de cada grupo" y en qué se diferencia de la desviación estándar de los valores de los elementos de cada grupo?