35 votos

¿Deben ser obligatoriamente Hermitianos los observables solo porque queremos autovalores reales, o hay algo más en ello?

Porque (después de una larga ausencia universitaria) me encontré recientemente con los operadores de campo nuevamente en mis clases de QFT (que no necesariamente son Hermitianos):

¿Cuál es el problema con los observables representados por operadores no-Hermitianos (por observables, obviamente no me refiero al significado tautológico de "operadores Hermitianos")?

Un problema seguro es que no tienen autovalores reales. Pero si digo que quiero "medir" alguna cantidad compleja, eso solo no debería ser un problema, estaría bien con autovalores complejos entonces.

Esta pregunta responde diciendo que los operadores son Hermitianos "si y solo si es diagonalizable en una base ortonormal con autovalores reales". Esto aún no parece ser un obstáculo para mí, siempre y cuando aún obtenga una base ortonormal.

Y dividiendo un operador arbitrario $\hat{O}$ en una parte Hermitiana y una anti-Hermitiana, eso correspondería a la parte real e imaginaria del observable, podría tomar valores esperados sin problemas.

Pero tal vez me estoy olvidando de algo, y existen otras buenas razones por las cuales los operadores no-Hermitianos llevarán a problemas tan serios.

25voto

mike stone Puntos 184

En el nivel más simple, se debe a que los operadores hermitianos, o más precisamente autoadjuntos, tienen un conjunto completo de estados propios. La existencia de un conjunto completo es esencial para la interpretación de la probabilidad en la Mecánica Cuántica. El hecho de que los autovalores sean reales es de menos importancia. Considere, por ejemplo, los operadores $X,Y$ de las coordenadas $x$ e $y$ de una partícula. Uno podría querer, por alguna razón, la combinación $x+iy=z$, que son los autovalores de $X+iY$.

Para permitir que los operadores como $X+iY$ sean observables, se puede relajar la condición de autoadjunto para permitir operadores normales, que están definidos como aquellos que conmutan con su adjunto: $[A,A^\dagger]=0$. En este caso, podemos descomponer $$ A= \frac 12 (A+A^\dagger) +\frac 12(A-A^\dagger), $$ y como $$ [(A+A^\dagger), (A-A^\dagger)]=0 $$ podemos diagonalizar simultáneamente el hermitiano $(A+A^\dagger)$ que tiene autovalores reales y $(A-A^\dagger)$ que, al ser antisimétrico hermitiano y por lo tanto $i$ veces un operador hermitiano, tiene autovalores puramente imaginarios. Entonces $A$ puede ser un observable con autovalores complejos.

10voto

Sandeep Puntos 111

En la formulación estándar de la teoría cuántica, los observables son autoadjuntos si hacen referencia a cantidades físicas cuyos valores están descritos por números reales. (Una generalización directa, al admitir observables que alcanzan valores complejos, es representarlos en términos de operadores normales y esto no afecta la discusión a continuación.)

Hay muchas motivaciones para esta suposición. Una de ellas, que se puede remontar a von Neumann, se basa en la formulación básica en términos de proposiciones elementales de SÍ-NO descritas en términos de proyectores ortogonales, etiquetados por subconjuntos (conjuntos de Borel) $E$ de $\mathbb{R}$: $P(E)$.

$P(E)$ corresponde a la proposición/observable elemental

"el resultado de la medición del observable considerado pertenece al subconjunto real $E$".

Si $\rho$ es el estado del sistema, $tr(\rho P(E))$ es la probabilidad de que el resultado del observable pertenezca a $E$.

Estas familias de proyectores son medidas de valores de proyección, PVM, y sus integrales $$A = \int_{\mathbb{R}}\lambda dP_\lambda$$ son operadores autoadjuntos. Viceversa, un operador autoadjunto $A$ define de manera única una PVM $\{P^{(A)}(E)\}_{E\in B(\mathbb{R})}$ a través del teorema espectral tal que $$A = \int_{\mathbb{R}}\lambda dP^{(A)}_\lambda$$ La correspondencia $$A\quad \leftrightarrow \quad \{P^{(A)}(E)\}_{E\in B(\mathbb{R})}$$ es de uno a uno. En este sentido, los observables son operadores autoadjuntos.

Este enfoque se puede encontrar en el libro de texto de von Neumann, en el libro de texto de Varadarajan y en otros libros sobre los fundamentos de la teoría cuántica (incluyendo un par de los míos).

Más recientemente, se ha presentado una vista más elaborada en términos de operaciones cuánticas. Una razón de esta investigación es el intento de definir una noción realista del estado posterior a la medición $\rho'$. Las nociones estándar basadas en los postulados de von Neumann, Luders y von Neumann-Luders, $$\rho' = \frac{P^{(A)}(E)\rho P^{(A)}(E)}{tr(\rho P^{(A)}(E))}\:,$$ se consideran actualmente bastante irrealistas, también en vista de una tecnología cuántica más elaborada a nuestra disposición.

Dentro de este nuevo enfoque, los observables elementales de SÍ-NO se reemplazan por los llamados POVM: medidas valoradas en términos de operadores positivos $\{Q(E)\}_{E\in B(\mathbb{R})}$ con $0\leq Q(E) \leq I$.

La génesis física de esta noción es un poco complicada y se basa en un procedimiento de medición indirecto que no destruye el sistema medido. De hecho, se mide, con un procedimiento estándar, un segundo sistema S' (destruyéndolo) que tenía una interacción dada (conocida) con el sistema inicial S que queremos medir. Si $\rho$ es el estado (generalmente mixto) de $S$, $tr(\rho Q(E))$ es la probabilidad de que el resultado del observable pertenezca a $E$. El efecto neto en S se describe, como se dijo, con un POVM en lugar de un PVM. La ventaja de este procedimiento es que permite controlar también el estado posterior a la medición del sistema S.

Una explicación rápida de estas ideas se puede encontrar en un buen artículo de P. Busch [1].

Volviendo al tema principal, incluso refiriéndose a POVMs, los operadores hermitianos surgen en todos los casos como consecuencia de resultados notables de Naimark.

Si $\{Q(E)\}_{E \in B(\mathbb{R})}$ es un POVM (normalizado) sobre la línea real $\mathbb{R}$, hay un operador hermitiano $A$ asociado a él, el único que cumple con $$\langle \psi| A \phi\rangle = \int_{\mathbb{R}} \lambda \mu_{\psi,\phi}^{(Q)}(\lambda)$$ donde (con algunos detalles que omito aquí sobre el dominio de $A$) $$\mu_{\psi,\phi}^{(Q)}(E) = \langle \psi| Q(E) \phi\rangle\:.$$ Viceversa (y este es el mencionado resultado de Naimark) cada operador hermitiano $A$ con dominio denso $D(A)$ puede ser descompuesto como se describe anteriormente por un POVM (con algunos detalles sobre el dominio). Ese POVM es único solo si $A$ es máximamente simétrico y es un PVM solo si $A$ es autoadjunto.

Estos resultados se pueden encontrar dispersos en la literatura. Una buena (pero muy amplia) referencia es el hermoso libro de Busch y colaboradores [2]. Un resumen de la interacción de POVMs y operadores hermitianos se puede encontrar en un artículo reciente de mí y N. Drago [3]

NOTA TÉCNICA Si $A: D(A) \to H$ es un operador lineal en el espacio de Hilbert $H$, siendo $D(A) \subset H$ un subespacio,

(i) $A$ es hermitiano si $\langle x| Ay\rangle = \langle Ax| y\rangle$ para cada $x,y \in D(A)$;

(ii) $A$ es simétrico si es hermitiano y $D(A)$ es denso.

(iii) $A$ es autoadjunto si es simétrico y más fuertemente $A=A^\dagger$, donde $A^\dagger : D(A^\dagger) \to H$ es el operador adjunto.


[1] P. Busch, No Information Without Disturbance: Quantum Limitations of Measurement in Quantum Reality, Relativistic Causality, and Closing the Epistemic Circle: An Interna- tional Conference in Honour of Abner Shimony, Perimeter Institute, Waterloo, Ontario, Canada, July 18-21, 2006, Eds J. Christian, W.Myrvold, Springer-Verlag, 2008, ISSN: 978- 1-4020-9106

[2] P.Busch, P.Lahiti, J.-P.Pellonpää, K.Ylinen, Quantum Measurement. Springer (2016)

[3] N. Drago y V.Moretti, The notion of observable and the moment problem for ∗- algebras and their GNS representations. Lett. Math. Phys, 110(7), 1711-1758 (2020)

5voto

Santosh Bachkar Puntos 26

Usar números reales para etiquetar los resultados de las mediciones es conveniente, porque podemos usar esas etiquetas para definir estadísticas resumen como promedios y desviaciones estándar. Pero usar números reales para etiquetar los resultados de las mediciones no es necesario, ni en el mundo real ni en la teoría cuántica. Puede ser abrumadoramente conveniente en la práctica, pero no es necesario en principio.

Observables de doble propósito

Algunos de los operadores que representan observables, como los operadores del momento angular, tienen un doble propósito. Además de representar algo que podría ser medido, los operadores del momento angular también son los generadores de rotaciones, por lo que son interesantes como observables. Para su papel como generadores de rotaciones, su autoadjuntos y su espectro son ambos esenciales, por lo que es natural usar esos operadores tal cual para representar el observable también.

Otro ejemplo importante de un observable de doble propósito es el observable de energía total, llamado el Hamiltoniano $H$. El Hamiltoniano genera traslaciones en el tiempo, y para ese propósito debe ser autoadjunto, porque la evolución en el tiempo debe ser unitaria.

Observables como la energía total y el momento angular total son prominentes en los libros de texto debido a su doble papel como generadores de simetrías, pero la mayoría de los observables de interés práctico son observables locales, un concepto que se pierde en modelos demasiado simples como la mecánica cuántica de una sola partícula no relativista. Los observables locales siguen siendo importantes incluso en modelos que no tienen simetrías, porque representan cosas que se pueden medir dentro de regiones finitas de espacio(tiempo). Estos son los observables que tengo principalmente en mente en los siguientes párrafos.

La representación del doble conmutante

En principio, un observable puede ser representado por el conjunto de posibles resultados de la medición, sin ninguna etiqueta numérica en absoluto. Según los principios más básicos de la teoría cuántica, cada uno de esos resultados está representado por un operador de proyección. (Generalizaciones como el uso de POVM pueden ser convenientes, pero siempre podemos lograr el mismo objetivo usando operadores de proyección ordinarios en un modelo más completo). La forma más básica de representar un observable es usar un conjunto de operadores de proyección mutuamente conmutativos, junto con todos los operadores de proyección que se pueden formar a partir de estos usando sumas y productos y límites. Los operadores de proyección son todo lo que necesitamos para calcular probabilidades y para usar la regla de proyección. (La regla de proyección se utiliza para calcular probabilidades para secuencias cronológicas de resultados de mediciones, y también la usamos implícitamente cada vez que elegimos un estado inicial basado en nuestro conocimiento de cómo se preparó el sistema físico).

Más precisamente, podemos representar un observable individual como el conjunto de todos los operadores de proyección en un álgebra de von Neumann conmutativo. Eso puede sonar intimidante, pero en realidad es bastante fácil de definir algebraicamente, gracias a algo llamado el teorema del conmutador doble. Sea $\Omega$ cualquier colección de operadores mutuamente conmutativos, junto con sus adjuntos. El conmutante de $\Omega$, denotado $\Omega'$, es el conjunto de todos los operadores que conmutan con todo en $\Omega$. Claramente $\Omega\subset\Omega'$. El conmutante doble de $\Omega$, denotado $\Omega''$, es el conjunto de todos los operadores que conmutan con todo en $\Omega'$. El conmutante doble $\Omega''$ es el álgebra de von Neumann más pequeña (autocontenido con respecto a sumas, productos y límites) que contiene todo en $\Omega$. Podemos usar el conjunto de todos los operadores de proyección en $\Omega''$ para representar un observable.

Consideremos el caso $\Omega=\{A\}$, donde $A$ es un observable autoadjunto único. Los operadores de proyección en $\{A\}'' incluyen todos los operadores de proyección involucrados en la medida valuada por proyección (PVM) asociada con la descomposición espectral de $A$. Si el espectro de $A$ es discreto, entonces $\{A\}''$ incluye todos los operadores de proyección en sus espacios propios. El conjunto de operadores de proyección en $\{A\}'' es la forma filosóficamente "pura" de representar el observable $A$. Podríamos tener $\{A\}'' = \{B\}''$ incluso si $A\neq B$, lo que significa que los operadores $A$ y $B$ realmente representan el mismo observable pero con etiquetas numéricas diferentes, porque $\{A\}''$ y $\{B\}'' ambos tienen los mismos operadores de proyección, ambos tienen el mismo conjunto de posibles resultados de medición, aunque los operadores $A$ y $B$ usen diferentes formas de etiquetar esos resultados.

Dado que la pregunta mencionó la idea de valores propios complejos, consideremos el observable $\{H\}''$, donde $H$ es el Hamiltoniano. El Hamiltoniano suele ser un operador no acotado, lo que significa que no está completamente definido en todo el espacio de Hilbert. Eso está bien, porque los operadores que implementan traslaciones en el tiempo son los operadores unitarios $e^{-iHt}$, que están definidos en todo el espacio de Hilbert, aunque $H$ no lo sea. Sus "valores propios" (valores del espectro) son complejos, pero tenemos la identidad $$ \{H\}'' = \{ e^{-iHt}\,|\,t\in\mathbb{R}\}'', $$ que dice que el conjunto de operadores de proyección generados por $H$ es el mismo que el conjunto de operadores de proyección generados por todos los operadores unitarios $e^{-iHt}$. En lo que respecta a su papel como observables, usar $H$ es equivalente a usar toda la colección de operadores unitarios $e^{-iHt}$, porque ambos generan el mismo conjunto de operadores de proyección, el mismo conjunto de posibles resultados de medición.

La conveniencia también es importante

La naturaleza no se preocupa por cómo etiquetamos los resultados de una medición, pero la conveniencia es aún una consideración importante. En la práctica, representar un observable como un único operador $H$ suele ser más conveniente que usar todo el conjunto de operadores $\{H\}''$ o $\{e^{-iHt}|t\in\mathbb{R}\}$. Las etiquetas numéricas reales también son convenientes, por las razones mencionadas anteriormente entre otras. Por lo tanto, no deberíamos ser demasiado críticos con los libros de texto por elevar la representación del operador hermitiano único al estatus de un postulado. Esa representación es tanto suficiente como conveniente. Sin embargo, saber que no es necesario es fundamentalmente satisfactorio, incluso si nunca explotamos esta libertad en la práctica.

4voto

pglpm Puntos 296

Me gustaría evitar, en primer lugar, una circularidad semántica, porque algunas literaturas definen lo "observable" como un operador Hermiteano, u operador autoadjunto, u objetos matemáticos similares.

Entonces, permíteme hacer dos preguntas con un punto de vista más práctico o experimental en su lugar:

  • ¿Deben describirse los resultados - valores y estadísticas - de una medición en un sistema cuántico mediante un operador Hermiteano?
  • ¿Puede una medición cuyos resultados sean números complejos, o vectores, o etiquetas como "sí" "no", ser descrita por un operador Hermiteano?

La respuesta a ambas es no: en el caso más general utilizamos algo llamado "medida con valores positivos de operador", de la cual los operadores hermiteanos son casos especiales.

La teoría moderna de la medición cuántica es mucho más general que la basada en operadores Hermiteanos. Una medición está representada más generalmente no por un operador Hermitiano, sino por una llamada medida con valores positivos de operador (POVM, o POV), también llamada "resolución de identidad" (y por varios otros nombres). Matemáticamente es un conjunto de operadores definidos positivos que suman al operador identidad.

Los POVM permiten situaciones más generales, como estas:

  • Mediciones afectadas por ruido en el aparato o imperfecciones experimentales.
  • Mediciones con más resultados que la dimensión del espacio de Hilbert (caso de dimensionalidad finita).
  • Mediciones con cualquier tipo de resultados. Es decir, no solo números reales, sino por ejemplo también números complejos, o tuplas de números, o elementos de un espacio vectorial, o resultados categóricos no representados por números: "arriba" y "abajo", "azul" "rojo" "verde", o lo que sea.

Creo que la última generalización es la que te interesa.

Un POVM maneja estas generalizaciones porque separa la topología (discreta o continua) del espacio de resultados de los valores específicos (numéricos o no) que podemos asociar a los resultados. El POVM, cuando se combina con el estado cuántico (operador de densidad), codifica la probabilidad de cada resultado sin preocuparse por cuál es el valor o etiqueta de ese resultado.

Si los resultados son numéricos y estamos interesados en estadísticas como la media y la desviación estándar, simplemente podemos obtener estas últimas combinando las probabilidades dadas por el POVM con los valores numéricos de los resultados.

Los operadores hermiteanos son un caso especial de POVM: combinan los operadores que producen las probabilidades de los resultados (los proyectores propios en este caso), con los valores de los resultados en el caso específico en el que estos valores son números reales (los autovalores).

Matemáticamente, la teoría de los POVM aún puede basarse en operadores hermiteanos, utilizando un sistema auxiliar. Personalmente veo esto como una posibilidad puramente matemática sin una fundamentación física convincente. Al final siempre debemos elegir algo como una "caja negra" en términos de la cual definimos el resto, y yo prefiero utilizar las matemáticas de POVM como punto de partida.

Permíteme añadir que aquí estamos hablando solo sobre las probabilidades y estadísticas de los resultados de una medición, no sobre el estado (si lo hay) que se produce después de la medición. Hoy tenemos una vista más general de eso también, que está conectada a los POVM. Consulta los textos a continuación sobre este tema.

Textos buenos para consultar sobre POVMs, su motivación, aplicaciones experimentales (que son muchas), casos especiales, etc., son por ejemplo:

2voto

Turd Ferguson Puntos 23

Las otras respuestas están un poco por encima de mi salario, pero siempre he escuchado esta historia:

Una transformación física $U : \mathcal{H} \to \mathcal{H}$ del espacio de Hilbert de estados $\mathcal{H}$ debe ser unitaria para que se preserve la normalización de los estados. Supongamos, además, que esta transformación depende suavemente de parámetros $x_\alpha$ con $U(0) = 1$. Entonces $$ U(x_\alpha) = 1 + K_\alpha x_\alpha + O(|x_\alpha|^2) $$ para algunos operadores $K_\alpha$. Aplicando la condición de unitariedad $$ 1 = U(x_\alpha)^\dagger U(x_\alpha) = 1 + (K_\alpha + K_\alpha^\dagger) x_\alpha + O(|x_\alpha|^2) $$ Así que $$ K_\alpha + K_\alpha^\dagger = 0 $$ Por lo tanto, vemos que los generadores $K_\alpha$ de la transformación $U(x_\alpha)$ son antihermíticos. En la teoría clásica, los observables son precisamente los generadores de las transformaciones del espacio de estados. Esto nos da la idea de que los observables cuánticos deben tener algo que ver con la Hermiticidad, ya que los generadores son antihermíticos. Es un hecho (misterioso) que en la teoría cuántica los observables se obtienen de los generadores mediante multiplicación por $-i$ (encontré algunos comentarios sobre este hecho aquí). Por lo tanto $$ P_\alpha = -iK_\alpha $$ son los observables correspondientes a la transformación $U(x_\alpha)$. Uno verifica $$ P_\alpha^\dagger = i K_\alpha^\dagger = -iK_\alpha = P_\alpha $$ Por lo tanto, los observables son (o deberían ser) Hermitianos.


Quizás el argumento al revés sea más convincente. En la teoría clásica, cada observable (función en el espacio de fase) genera localmente un flujo físico de estados. Supongamos que queremos que esto sea cierto en la teoría cuántica. Los únicos candidatos para observables son funciones lineales en el espacio de Hilbert (en realidad no estoy seguro de por qué deben ser lineales). Si queremos que estos observables generen un flujo físico en los estados, deben ser (hasta la multiplicación por $i$) Hermitianos. Si los observables no son Hermitianos, el flujo que generan no preservará la normalización de los estados.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X