Hago un poco de trampa para dar esta respuesta, porque estoy bastante seguro de que es parte de la motivación de Gil al hacer la pregunta. La generalización más natural de la hipótesis de Birkhoff a la probabilidad cuántica sólo es cierta para los qubits. (También podría ser cierta para un tensor de qubits un sistema clásico; no he comprobado ese caso).
Un espacio cuantificable es un álgebra de von Neumann. Lo que más nos interesa es el caso de dimensión finita, donde clásicamente "espacio medible" es sólo un nombre elegante para las variables aleatorias en un conjunto finito. Un álgebra de von Neumann de dimensión finita es una suma directa de álgebras matriciales. En particular, $M_2$ se llama qubit y $M_d$ se denomina qudit.
Para abreviar, la hipótesis de Birkhoff puede afirmarse para una suma directa de $a$ copias de $M_b$ o $aM_b$ . En este entorno, un mapa doblemente estocástico $E$ es un mapa lineal desde $aM_b$ a sí mismo que preserva la traza, que preserva el elemento de identidad, y que es completamente positivo. En esta configuración, $E$ es completamente positiva si toma elementos semidefinidos positivos de $aM_b$ a elementos semidefinidos positivos, y si $E \otimes I$ también tiene esa propiedad en el álgebra $aM_b \otimes N$ para otro von Neumann o $C^*$ -Álgebra $N$ . El análogo natural de las matrices de permutación son los automorfismos del álgebra * de $aM_b$ . Se trata de permutaciones de los bloques de la matriz, compuestas con mapas de la forma $E(x) = uxu^*$ , donde $u$ es un elemento unitario de $aM_b$ . La cuestión, como antes, es si los mapas doblemente estocásticos son el casco convexo de los automorfismos.
Esta hipótesis de Birkhoff es cierta para $M_2$ , falso para $M_d$ para $d \ge 3$ y debería comprobarlo para $nM_2$ . Es cierto para $aM_1 = a\mathbb{C}$ porque entonces es el teorema habitual de Birkhoff-von Neumann.
Me queda la duda de dos versiones clásicas infinitas del teorema de Birkhoff, para las álgebras $\ell^\infty(\mathbb{N})$ y $L^\infty([0,1])$ . En el primer caso, uno se preguntaría si cualquier mapa estocástico que preserve la medida de recuento (aunque la medida de recuento no esté normalizada) es una suma convexa infinita de permutaciones de $\mathbb{N}$ . En este último caso, si cualquier mapa estocástico que preserva la medida de Lebesgue es una integral convexa de permutaciones que preservan la medida de $[0,1]$ . Adenda: Al menos el caso del infinito discreto se aborda, con resultados generalmente positivos, en esta revisión y en esta revisión más antigua . El documento más antiguo también plantea la cuestión continua, pero sin resultados. Sin embargo, buscando un poco más en Google, encontré este documento de contraejemplo .
Ya que Gil pide una referencia, una reciente es Canales cuánticos unitales - Estructura convexa y revivir el teorema de Birkhoff de Mendl y Wolf.
Aquí también hay una generalización combinatoria más ortodoxa del teorema de Birkhoff, y también otro caso que encontré una vez que está entre una generalización y una no-generalización. Como Gil ofrece ahora una recompensa, quizá sea mejor fusionar esta respuesta con la otra.
Una matriz doblemente estocástica puede interpretarse como un flujo a través de un grafo dirigido, con capacidades unitarias. (Véase Matriz unimodular en la Wikipedia; lo aprendí hace tiempo de Jesús de Loera). Cualquier gráfico de este tipo tiene un politopo de flujos, llamado politopo de flujos de red. Cualquier politopo de flujos de red tiene vértices enteros, porque es un politopo totalmente unimodular.
Un politopo totalmente unimodular es un politopo cuyas facetas tienen ecuaciones enteras, y con la propiedad de que cualquier colección máxima y linealmente independiente de facetas se interseca en un punto entero porque su matriz tiene determinante $\pm 1$ . En particular, los vértices son tales intersecciones, por lo que los vértices son todos integrales. Esta es una amplia generalización del teorema de Birkhoff que proviene de la generalización de una de las pruebas del teorema de Birkhoff.
Ejemplo: Una matriz de signo alterno equivale a una orientación de hielo cuadrado de una rejilla cuadrada. Las orientaciones del hielo cuadrado pueden definirse mediante un flujo de red, por lo que se obtiene un politopo de matriz de signo alterno. El teorema de Birkhoff generalizado en este caso dice que cada vértice del politopo es una matriz de signo alterno, de hecho que cada punto entero del $n$ -es una suma de $n$ matrices de signo alterno.
El otro caso que encontré fue el politopo de coincidencias perfectas fraccionadas de un conjunto no bipartito con $2n$ elementos. En cambio, el politopo de Birkhoff es el caso de un conjunto bipartito con $n$ elementos de cada tipo. Por definición, es el politopo de pesos no negativos asignados a las aristas del grafo completo en $2n$ vértices, de forma que el peso total en cada vértice sea 1. En sentido estricto, el teorema de Birkhoff es falso; no todos los vértices son una combinación perfecta. En su lugar, todos los vértices son combinaciones de pares emparejados, y los ciclos Impares con peso $\frac12$ .
A primera vista, esto parece una mala noticia para la aplicación del cálculo de un emparejamiento perfecto o del emparejamiento perfecto óptimo de un gráfico. En efecto, si se toma el casco convexo de los emparejamientos perfectos, el resultado es un politopo con un número exponencial de facetas. Sin embargo, existe un buen algoritmo de todos modos; hay una versión del algoritmo simplex que sólo utiliza polinomialmente muchas de las facetas.