¿Cómo es la dualidad Schur-Weyl (específicamente, el hecho de que las acciones del anillo de grupo $\mathbb{K}\left[ S_{n}\right] $ y el anillo monoide $\mathbb{K}\left[ \left( \operatorname*{End}V,\cdot\right) \right] $ en la potencia del tensor $V^{\otimes n}$ son los centralizadores de cada uno) para un campo $\mathbb{K}$ de la característica $0$ ¿Probado constructivamente?
Permítanme ahora definir las nociones y explicar lo que entiendo por "constructivamente" y lo que quiero evitar.
Anotaciones
Dejemos que $\mathbb{K}$ sea un campo de característica $0$ . Arreglar $n\in\mathbb{N}$ y dejemos que $S_{n}$ sea el grupo simétrico del conjunto $\left\{ 1,2,\ldots,n\right\} $ .
Dejemos que $V$ sea una dimensión finita $\mathbb{K}$ -espacio vectorial. El grupo simétrico $S_{n}$ actúa sobre el $n$ -a potencia del tensor $V^{\otimes n}$ permutando los tensorandos:
$\sigma\left( v_{1}\otimes v_{2}\otimes\cdots\otimes v_{n}\right) =v_{\sigma^{-1}\left( 1\right) }\otimes v_{\sigma^{-1}\left( 2\right) }\otimes\cdots\otimes v_{\sigma^{-1}\left( n\right) }$ para todos $\sigma\in S_{n}$ y $v_{1},v_{2},\ldots,v_{n}\in V$ .
Así, el anillo de grupo $\mathbb{K}\left[ S_{n}\right] $ actúa sobre $V^{\otimes n}$ también (por linealidad). Esto hace que $V^{\otimes n}$ en un $\mathbb{K} \left[ S_{n}\right] $ -módulo.
Por otro lado, el monoide $\left( \operatorname*{End}V,\cdot\right) $ actúa sobre $V^{\otimes n}$ de la siguiente manera:
$M\left( v_{1}\otimes v_{2}\otimes\cdots\otimes v_{n}\right) =Mv_{1}\otimes Mv_{2}\otimes\cdots\otimes Mv_{n}$ para todos $M\in\operatorname*{End}V$ y $v_{1},v_{2},\ldots,v_{n}\in V$ .
Por lo tanto, el anillo monoide $\mathbb{K}\left[ \left( \operatorname*{End} V,\cdot\right) \right] $ actúa sobre $V^{\otimes n}$ también. Esto hace que $V^{\otimes n}$ en un $\mathbb{K}\left[ \left( \operatorname*{End} V,\cdot\right) \right] $ -módulo.
(Muchos autores tienden a restringir este módulo a un $\mathbb{K}\left[ \operatorname*{GL}V\right] $ -pero esto no se siente particularmente natural para mí. En cualquier caso, estas cosas se comportan de forma bastante intercambiable).
Dualidad Schur-Weyl hace las siguientes dos afirmaciones:
(a) Cada endomorfismo del $\mathbb{K}\left[ S_{n}\right] $ -Módulo $V^{\otimes n}$ es la acción de algún elemento de $\mathbb{K}\left[ \left( \operatorname*{End}V,\cdot\right) \right] $ .
(b) Cada endomorfismo del $\mathbb{K}\left[ \left( \operatorname*{End}V,\cdot\right) \right] $ -Módulo $V^{\otimes n}$ es el acción de algún elemento de $\mathbb{K}\left[ S_{n}\right] $ .
En general, "algún elemento" no está determinado de forma única, ya que ninguna de las dos estructuras modulares es fiel. La página web $\mathbb{K}\left[ S_{n}\right] $ -Módulo es fiel cuando $n\leq\dim V$ La $\mathbb{K}\left[ \left( \operatorname*{End}V,\cdot\right) \right] $ -La estructura del módulo es probablemente nunca es fiel. Los cocientes que sí actúan fielmente pueden ser descritos, pero esto es una historia diferente.
¿Cómo se suele demostrar esto?
Para un teorema que aparece en todos los libros de teoría de la representación, la dualidad Schur-Weyl parece tener una escasez de pruebas realmente distintas. El argumento argumento (como se da, por ejemplo, en §4.18 y §4.19 de Pavel Etingof et al, Introducción a la teoría de la representación arXiv:0901.0827v5 ) procede, a grandes rasgos, como sigue: [ EDITAR: La prueba que se expone a continuación no es ni la versión más sencilla ni la más hábil del argumento estándar. El Texto de Etingof-et-al lo hace de una manera mucho más clara, factorizando algunos de los argumentos de los módulos semisimples en un lema general. Como han señalado los comentaristas, David Speyer y Mark Wildon (en la pregunta #90094 de MO) han elementarizado aún más el argumento pero sus versiones todavía no son tan ligeras como me gustaría que fueran (por ejemplo, todavía utilizan el lema de Schur, que requiere una prueba de irreductibilidad absoluta)].
-
Primero pruebe la parte (a) utilizando métodos bastante elementales. (Esquema: Sea $f$ sea un endomorfismo de la $\mathbb{K}\left[ S_{n}\right] $ -Módulo $V^{\otimes n}$ . Escriba $f$ como $\mathbb{K}$ -combinación lineal de endomorfismos de la forma $f_{1}\otimes f_{2}\otimes\cdots\otimes f_{n}$ , donde cada $f_{i}$ está en $\operatorname*{End}V$ . Desde $f$ es $\mathbb{K} \left[ S_{n}\right] $ -equivariante, podemos simetrizarlo, de modo que $f$ también se convierte en un $\mathbb{K}$ -combinación lineal de endomorfismos de la forma $\dfrac{1}{n!}\sum_{\sigma\in S_{n}}f_{\sigma\left( 1\right) }\otimes f_{\sigma\left( 2\right) }\otimes\cdots\otimes f_{\sigma\left( n\right) } $ donde cada $f_{i}$ está en $\operatorname*{End}V$ . Queda por demostrar que cada endomorfismo de esta última forma es la acción de algún elemento de $\mathbb{K}\left[ \left( \operatorname*{End}V,\cdot\right) \right] $ . Este se hace utilizando alguna identidad de polarización, por ejemplo $\sum_{\sigma\in S_{n} }f_{\sigma\left( 1\right) }\otimes f_{\sigma\left( 2\right) }\otimes \cdots\otimes f_{\sigma\left( n\right) }=\sum_{I\subseteq\left\{ 1,2,\ldots,n\right\} }\left( -1\right) ^{n-\left\vert I\right\vert }\left( \sum_{i\in I}f_{i}\right) ^{\otimes n}$ .)
-
Dejemos que $B$ sea el $\mathbb{K}$ -Álgebra $\operatorname*{End} \nolimits_{\mathbb{K}\left[ S_{n}\right] }\left( V^{\otimes n}\right) $ . Entonces, $B$ es un cociente de $\mathbb{K}\left[ \left( \operatorname*{End} V,\cdot\right) \right] $ por la parte (a) . Así, $\operatorname*{End} \nolimits_{\mathbb{K}\left[ \left( \operatorname*{End}V,\cdot\right) \right] }\left( V^{\otimes n}\right) =\operatorname*{End}\nolimits_{B} \left( V^{\otimes n}\right) $ .
-
Recordemos que $\mathbb{K}\left[ S_{n}\right] $ es un álgebra semisimple (por Teorema de Maschke), y por tanto $V^{\otimes n}$ se descompone como $V^{\otimes n}=\bigoplus_{\lambda\in\Lambda}V_{\lambda}\otimes L_{\lambda}$ para algunos conjunto finito $\Lambda$ , algunos no nulos $\mathbb{K}$ -espacios vectoriales $V_{\lambda}$ y alguna simple no isomorfa por pares $\mathbb{K}\left[ S_{n}\right] $ -módulos $L_{\lambda}$ . Concluir que $\operatorname*{End} \nolimits_{\mathbb{K}\left[ S_{n}\right] }\left( V^{\otimes n}\right) \cong\prod_{\lambda\in\Lambda}\operatorname*{End}\left( V_{\lambda}\right) $ . Este es un paso especialmente complicado, ya que aquí ocurren varias cosas a la vez a la vez: En primer lugar, tenemos que saber que $\operatorname*{End} \nolimits_{\mathbb{K}\left[ S_{n}\right] }\left( L_{\lambda}\right) \cong\mathbb{K}$ lo que sería una consecuencia del lema de Schur si supusiéramos que que $\mathbb{K}$ es algebraicamente cerrado, pero como no lo tenemos, requiere algún conocimiento de la teoría de la representación de $S_{n}$ (es decir, del hecho de que el simple $\mathbb{K}\left[ S_{n}\right] $ -son los módulos Specht, y son absolutamente simples). Pero incluso sabiendo eso, necesitamos saber que los anillo de endomorfismo de una suma directa de módulos irreducibles $\mathbb{K}\left[ S_{n}\right] $ -se descompone como un producto directo según la componentes isotípicos, y en cada componente es un anillo de matriz. Esta es la teoría teoría de las álgebras semisimples, pero también requiere una cantidad no trivial de trabajo.
-
Ahora, $B=\operatorname*{End}\nolimits_{\mathbb{K}\left[ S_{n}\right] }\left( V^{\otimes n}\right) \cong\prod_{\lambda\in\Lambda} \operatorname*{End}\left( V_{\lambda}\right) $ Así pues, el $V_{\lambda}$ para $\lambda\in\Lambda$ son los simples $B$ -módulos. Por lo tanto, la descomposición $V^{\otimes n}=\bigoplus_{\lambda\in\Lambda}V_{\lambda}\otimes L_{\lambda}$ puede verse como una descomposición del $B$ -Módulo $V^{\otimes n}$ en simples. Por lo tanto, los endomorfismos de la $B$ -Módulo $V^{\otimes n}$ son directos sumas de la forma $\bigoplus_{\lambda\in\Lambda}\operatorname*{id} \nolimits_{V_{\lambda}}\otimes f_{\lambda}$ donde cada $f_{\lambda}$ se encuentra en $\operatorname*{End}\left( L_{\lambda}\right) $ . (Esto, de nuevo, requiere algunos teoría básica de módulos semisimples). Ahora es sencillo demostrar que todos los tales isomorfismos son acciones de elementos de $\mathbb{K}\left[ S_{n}\right] $ (de hecho, el $L_{\lambda}$ son pares no isomórficos simples $\mathbb{K} \left[ S_{n}\right] $ -y por lo tanto $\prod_{\lambda\in\Lambda }\operatorname*{End}\left( L_{\lambda}\right) $ es un cociente de $\mathbb{K}\left[ S_{n}\right] $ ). Debido a $\operatorname*{End} \nolimits_{\mathbb{K}\left[ \left( \operatorname*{End}V,\cdot\right) \right] }\left( V^{\otimes n}\right) =\operatorname*{End}\nolimits_{B} \left( V^{\otimes n}\right) $ Esto da como resultado la parte (b) .
¿Qué es lo que quiero?
Estoy bastante contento con la prueba de parte (a) dado anteriormente, pero la prueba de parte (b) es exactamente el tipo de argumento que evito. Es implícito, no constructivo y se basa en medio semestre de teoría de la representación teoría de la representación. Probablemente mi mayor problema con él es estético - veo (b) como un problema combinatorio (al menos muchas de sus invariantes teóricas aplicaciones son de naturaleza combinatoria), pero la prueba es peinar este gato completamente a contrapelo (si no tirando de él por la cola). Pero pedir una prueba combinatoria o explícita no es un problema bien definido, mientras que pedir una constructiva, al menos, está bien definido.
Dicho esto, sospecho que se puede obtener una prueba constructiva mediante alguna manipulaciones sencillas del argumento anterior. La teoría de la representación de $S_{n}$ puede hacerse de forma constructiva (véase, por ejemplo Notas de Adriano Garsia sobre La forma seminormal de Young ), y la mayoría de los argumentos de las álgebras semisimples pueden emularse con el álgebra lineal simple (aunque perdiendo el poco significado significado intuitivo que tienen). Yo preferiría algo que evitara esto y simplifique significativamente la teoría de la representación o la sustituya por algo completamente diferente.
¿Qué se ha hecho?
Mis esperanzas de una prueba mejor tienen una razón: La dualidad Schur-Weyl realmente funciona en una generalidad mucho mayor que la demostración anterior. El teorema 1 en Steven Doty's Dualidad Schur-Weyl en característica positiva (arXiv:math/0610591v3) afirma que tanto (a) y (b) se mantienen para cualquier campo infinito $\mathbb{K}$ , ¡no importa cuál sea su característica! Sin embargo, la prueba en ese documento, va de la cabeza (tampoco es autocontenida, por lo que las 17 páginas no son un límite superior). Otro artículo que podría contener respuestas es Roger W. Carter y George Lusztig, Sobre las representaciones modulares de los sistemas lineales generales y grupos simétricos pero ese parece aún menos accesible.
Por supuesto, me encantaría ver una prueba que funcione para cualquier campo infinito $\mathbb{K}$ o quizás más generalmente para cualquier anillo conmutativo $\mathbb{K}$ suponiendo que sustituimos los endomorfismos de la $\mathbb{K} \left[ \left( \operatorname*{End}V,\cdot\right) \right] $ -Módulo $V^{\otimes n}$ por una noción más razonable de $\operatorname*{GL} $ -(es decir, endomorfismos de $V^{\otimes n}$ que conmutan con la acción de un "genérico $n\times n$ -matriz" adosada libremente a la base base). Pero me alegraría bastante ver la dualidad Schur-Weyl de vainilla demostrada de forma clara.
Un paso que se puede hacer fácilmente es una prueba de parte (b) en el caso de que $\dim V\geq n$ . Concretamente, en este caso, podemos argumentar lo siguiente: Sea $\left( e_{1},e_{2},\ldots,e_{d}\right) $ sea la base estándar de $V$ Así que.., $d=\dim V\geq n$ . Sea $F$ sea un endomorfismo de la $\mathbb{K}\left[ \left( \operatorname*{End}V,\cdot\right) \right] $ -Módulo $V^{\otimes n}$ . Sea $\eta=F\left( e_{1}\otimes e_{2}\otimes\cdots\otimes e_{n}\right) $ . En cada $n$ vectores $v_{1},v_{2},\ldots,v_{n}\in V$ podemos encontrar un mapa lineal $M\in\operatorname*{End}V$ satisfaciendo $v_{i}=Me_{i}$ para todos $i\in\left\{ 1,2,\ldots,n\right\} $ y, por lo tanto, tenemos
$F\left( v_{1}\otimes v_{2}\otimes\cdots\otimes v_{n}\right) =F\left( Me_{1}\otimes Me_{2}\otimes\cdots\otimes Me_{n}\right) $
$=\left( M\otimes M\otimes\cdots\otimes M\right) \underbrace{F\left( e_{1}\otimes e_{2}\otimes\cdots\otimes e_{n}\right) }_{=\eta}$ (ya que $F$ es $\mathbb{K}\left[ \left( \operatorname*{End}V,\cdot\right) \right] $ -equivariante)
$=\left( M\otimes M\otimes\cdots\otimes M\right) \eta$ .
Así, el valor de $\eta$ determina de forma única el endomorfismo $F$ . Además, podemos escribir $\eta$ como $\mathbb{K}$ -combinación lineal de la pura de tensores puros de la forma $e_{i_{1}}\otimes e_{i_{2}}\otimes\cdots\otimes e_{i_{n}}$ y demostrar que, para cada uno de esos tensores puros que se dan en esta línea combinación lineal (con coeficiente no nulo), el $n$ -tupla $\left( i_{1} ,i_{2},\ldots,i_{n}\right) $ debe ser una permutación de $\left( 1,2,\ldots ,n\right) $ . (Para demostrar esto, suponemos lo contrario; es decir, suponemos que el $n$ -tupla $\left( i_{1},i_{2},\ldots,i_{n}\right) $ no es una permutación de $\left( 1,2,\ldots,n\right) $ pero el tensor $e_{i_{1}}\otimes e_{i_{2} }\otimes\cdots\otimes e_{i_{n}}$ se produce en $\eta$ . Por lo tanto, cualquiera de los números $i_{1},i_{2},\ldots,i_{n}$ es $>n$ o dos de estos números son iguales. En el primer caso, elija un $M\in\operatorname*{End}V$ que envía el correspondiente $e_{i_{k}}$ à $0$ En el segundo, elija un $M\in \operatorname*{End}V$ que multiplica el correspondiente $e_{i_{k}}$ por un genérico $\lambda$ . En cualquier caso, vuelva a utilizar el $\mathbb{K}\left[ \left( \operatorname*{End}V,\cdot\right) \right] $ -equivarianza de $F$ para obtener algo absurdo. Perdón por la falta de detalles). El resultado es que $\eta$ es un $\mathbb{K}$ -combinación lineal de varias permutaciones de $e_1 \otimes e_2 \otimes \cdots \otimes e_n$ y por lo tanto, $F$ (siendo determinado por este $\eta$ ) es la acción de algún elemento de $\mathbb{K}\left[S_n\right]$ .
Sin embargo, este argumento se rompe por completo cuando $\dim V<n$ ya que $e_{1}\otimes e_{2}\otimes\cdots\otimes e_{n}$ ya no existe. ¿Es hay alguna manera de arreglarlo, o es un callejón sin salida?
( Observación: Este argumento para la parte (b) en el caso $\dim V \geq n$ es bastante similar a la demostración del Teorema 3.6 en Tom Halverson, Arun Ram, Álgebras de partición arXiv:math/0401314v2 , que en sí misma es una especie de dualidad Schur-Weyl (¡pero en la que el grupo simétrico actúa sobre cada tensorando en lugar de permutar los tensorandos!)
Unas cuantas indicaciones más:
-
Tal vez el truco unitario de Weyl proporcione otra prueba de la dualidad Schur-Weyl, pero probablemente no sería constructiva ni combinatoria en mi opinión (¡medida de Haar!).
-
Hay varios trabajos sobre un enfoque combinatorio de la teoría de invariantes (por ejemplo, D. Eisenbud, D. De Concini, C. Procesi, Diagramas de Young y variedades determinantes que parece ser uno de los más legibles). Sin embargo, no está claro si dan una respuesta. La teoría invariante del $\operatorname{GL}$ -sobre tuplas de vectores y covectores (por multiplicación izquierda/derecha) se suele derivar (en la característica $0$ En el enfoque no combinatorio) a partir de la dualidad Schur-Weyl; sin embargo, no sé cómo se podría ir en la dirección inversa (después de todo, la proyección del álgebra tensorial al álgebra simétrica no es inyectiva). La FFT para la teoría invariante del $\operatorname{GL}$ -La acción sobre tuplas de matrices por conjugación (simultánea) es en realidad equivalente a la dualidad Schur-Weyl, pero no he visto a nadie reclamar una aproximación combinatoria a la misma.
-
La tesis de Schur Sobre una clase de matrices que pueden ser asignadas a una matriz dada está disponible en línea en dos lugares ( EUDML/GDZ y archive.org/Harvard ), pero no estoy seguro de que la dualidad Schur-Weyl esté realmente ahí. (Sus anotaciones son lo suficientemente anticuadas como para que incluso buscar el enunciado sea una tarea no trivial).
-
La noción de "dualidad Schur-Weyl" no está estandarizada en la literatura; algunos autores utilizan este nombre para diferentes afirmaciones. Por ejemplo, Daniel Bump, en el capítulo 34 de su Grupos de Lie (2ª edición), demuestra algo que llama "dualidad Frobenius-Schur", y afirma que es exactamente la dualidad Schur-Weyl. Pero no es lo que yo llamo dualidad Schur-Weyl arriba; es sólo la correspondencia uno a uno entre representaciones de grupos simétricos y funtores de Schur.
ACTUALIZACIÓN: En los comentarios a esta entrada, Frieder Ladisch me ha alertado del hecho de que el teorema del doble centralizador (o, mejor dicho, la parte del teorema del doble centralizador que es relevante para la demostración de la parte b) ) puede demostrarse constructivamente (siempre que la entrada sea suficientemente explícita). Y ahora estoy viendo que esencialmente su prueba aparece en la sección 11.1 de Jan Draisma y Dion Gijswijt, Teoría Invariante con Aplicaciones . (Jan: Me he tomado la libertad de adivinar la URL del archivo PDF, al ver que el hipervínculo estaba roto debido a una ruta relativa incorrecta. Si realmente no quiere que estas notas estén enlazadas, por favor hágamelo saber). Algunas partes de su argumento deben ser ligeramente modificadas para asegurar la constructividad: El uso de la continuidad en la demostración del Teorema 11.1.1 debe ser sustituido por un argumento directo utilizando la densidad de Zariski. El grupo $H$ en el Teorema 11.1.2 debe exigirse que sea finito. El espacio vectorial $W$ en el Teorema 11.1.2 debe exigirse que sea de dimensión finita. El requisito del Teorema 11.1.2 de que la representación $\lambda$ ser completamente reducible debe ser sustituido por un requisito de que $\left|H\right|$ es invertible en el campo de tierra. El complemento directo $U$ de $M$ en la demostración del teorema 11.1.2 debe construirse utilizando el teorema de Maschke, que tiene una demostración bien conocida que se basa simplemente en el álgebra lineal (a saber, la existencia de un complemento de un subespacio explícitamente definido de un espacio vectorial de dimensión finita).
Por supuesto, este bello argumento sigue siendo "inexplícito" en el sentido de que utiliza algunas ideas de la teoría de la representación. Pero los peores infractores (la teoría de Artin-Wedderburn, el paso al cierre algebraico, el análisis/la geometría, etc.) han desaparecido. Si hubiera conocido este argumento de antemano, no habría hecho esta pregunta. Sin embargo, dejo esta pregunta abierta, ya que todavía tengo que digerir otras respuestas, algunas de las cuales parecen conducir a pruebas más generales, tal vez incluso en característica positiva (para cualquier parte de la dualidad Schur-Weyl que se mantenga allí).