5 votos

La minimización de los números a lo largo de la diagonal

Por favor, perdona mi ignorancia si no es este el lugar adecuado para hacer esta pregunta, yo soy de ninguna manera un experto en estadística.

Voy a omitir la mayoría de los esotéricos lingüística detalles aquí, pero me he topado con un obstáculo uso de Excel, donde estoy tratando de minimizar los valores a lo largo de la diagonal, (parte superior izquierda a la inferior derecha). Yo preferiría más pequeño de los números para estar cerca de la diagonal, y los números más grandes para estar más alejado de ello.

Sólo hay dos limitaciones;

(1) las células Individuales no se puede mover, sólo las filas y columnas; es decir, la relación entre todos los valores a lo largo de la fila o columna debe ser mantenida con cualquier movimiento.

(2) Para cada turno en una fila tiene que ser un movimiento simétrico en las columnas. por ejemplo, si la fila 3 se desplaza hacia abajo a tres, la columna C debe ser movido a la derecha por tres así.

Estoy abierto a la utilización de cualquier tipo de software y de volver a formatear mis datos en cualquier forma, voy a publicar algunas fotos de abajo para dar algunas pistas sobre qué tipo de operaciones que estoy esperando a realizar. Es posible que el minio valores ya están más cerca de la diagonal, en la segunda foto, pero quiero ser capaz de demostrar estadísticamente que los números no pueden ser más bajo.

Gracias de antemano


El primer gráfico es una captura de pantalla de los datos en bruto; se muestra la similitud (los números más bajos son más similares) entre las letras en el pre-árabe clásico. Los datos están en orden alfabético, pero para mi propósito de este orden es arbitrario.

Raw data, in alphabetical order

La segunda es mi intento de organización basado en algunas conjeturas en cómo la fonología podría haber sido; en este diseño las letras que están más cerca el uno del otro son más similares entre sí, y por lo tanto tienen un menor número.

enter image description here

4voto

Judioo Puntos 625

El segundo ejemplo a mí me parece que hiciste un buen trabajo (así que yo no esperaría a mejorar mucho). La restricción 1 es bastante normalmente, pero nunca he visto restricción 2 antes, por lo que usted puede necesitar una nueva solución. Ver las referencias de algunos ejemplos de ordenar tablas, es posible estimar la agrupación jerárquica de soluciones para las filas y columnas y, a continuación, cortar el dendrograma de forma arbitraria para satisfacer sus necesidades. (O puede haber otras heurísticas basadas en soluciones de PCA que trabajan para su ejemplo.) A pesar de que aquellos no se centran específicamente en la diagonal.

Una técnica sencilla es por orden de fila y/o columna de sumas de dinero, por lo que solo ve por su ejemplo si hay filas/columnas que sobresalen. Que es bastante fácil de hacer en excel ;)

También me gustaría evitar el color rojo-verde de la escala. Stephen few tiene algunos aplicable sugerencias aquí. Con sólo 5 valores que puede zanja, los números juntos y el uso secuencial de rampa de color.

Referencias

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X