¿Cuál es el trabajo realizado en el sistema? ¿Está bien definido?
Podemos elegir una definición que se comporte como queremos en determinadas situaciones, pero sea cual sea la definición que elijamos, no será perfecta (Ejemplos 1-4). Tener en cuenta la reacción contraria no soluciona este problema. En su lugar, pone de manifiesto una ambigüedad más profunda (Ejemplo 5).
Eso está bien, porque el concepto o conceptos de "trabajo" no son uno de los conceptos fundacionales de nuestra comprensión actual de la naturaleza. En lugar de intentar perfeccionar la definición de "trabajo", podemos hacer las cosas al revés. Para cualquier experimento que tradicionalmente describiríamos en términos de "trabajo", podemos intentar describir el experimento en términos más fundamentales.
El resto de esta respuesta consiste en ejemplos que ilustran por qué creo que una definición unificada e inequívoca de "trabajo" no es factible ni necesaria. Contenido:
-
Ejemplo 1: Partícula cargada en un campo eléctrico uniforme
-
Ejemplo 2: Una superposición artificial
-
Ejemplo 3: Mecánica estadística
-
Ejemplo 4: Igualdad de Jarzynski (versión cuántica)
-
Ejemplo 5: Contabilización de la reacción contraria
Ejemplo 1: Partícula cargada en un campo eléctrico uniforme
Este es un caso especial de la configuración general descrita en el PO. En este ejemplo, normalmente diríamos que se está trabajando, aunque $H(t)$ es independiente de $t$ .
Consideremos una partícula cargada en un potencial externo cuyo gradiente representa un campo eléctrico externo. En la representación habitual, el Hamiltoniano es $$ H = \frac{-(\hbar \nabla)^2}{2m}+V(x), $$ utilizando un espacio unidimensional para simplificar. Tomemos el campo eléctrico (proporcional a $\nabla V$ ) sea uniforme en una gran región del espacio, y tomemos el estado inicial de la partícula como un paquete de ondas gaussiano con momento neto cero, localizado en algún lugar cerca del centro de esa región.
Ya sabemos lo que ocurre: la partícula se acelera. Más exactamente, el valor de expectativa del operador de posición se acelera. Por analogía con la mecánica clásica, diríamos que el campo eléctrico está haciendo "trabajo" sobre la partícula.
En este caso, "trabajo" se refiere a un cambio en (el valor esperado de) pieza de la energía del sistema, es decir, la energía cinética de la partícula. La palabra clave es pieza un tema que se volverá a tratar en el ejemplo 5.
Ejemplo 2: Una superposición artificial
Consideremos de nuevo el modelo de una sola partícula cargada, con un Hamiltoniano de la forma mostrada anteriormente. Esta vez, tomemos que el campo es uniforme en dos grandes regiones del espacio, $R$ y $L$ con el vector campo eléctrico dirigido hacia la derecha en $R$ y a la izquierda en $L$ . Tomemos el estado inicial como una superposición de dos paquetes de ondas gaussianas que se mueven hacia la derecha, uno en el centro de $R$ y uno en medio de $L$ .
De nuevo, ya sabemos lo que ocurre en esta situación: el paquete de ondas de una región se acelera y el de la otra región se desacelera. Pero acabamos de un partícula, cuyo estado es una superposición cuántica de estos dos paquetes de ondas, uno acelerando y otro decelerando, y podemos elegir las magnitudes del campo en cada región de modo que el valor de la expectativa del momento de la partícula no cambie en absoluto.
¿Cómo deberíamos cuantificar el "trabajo" realizado sobre la partícula en este caso? ¿Es el "trabajo" un concepto útil en este caso?
Ejemplo 3: Mecánica estadística
Consideremos la primera ley de la termodinámica: $T\,dS=dE+p\,dV$ . Normalmente describimos el cambio global en la energía del sistema (el $dE$ término) como debida en parte al "trabajo" (el $p\,dV$ término) y en parte debido a la transferencia de calor (el $T\,dS$ término).
En mecánica estadística, interpretamos $S(E,V)$ como el logaritmo del número de microestados compatibles con las restricciones dadas sobre la energía total $E$ y el volumen total $V$ y la primera ley es simplemente la definición de $T$ y $p$ .
En un sistema con un número enorme de partículas, la mayoría de los microestados compatibles con la restricción de volumen $V$ son estados en los que las partículas se distribuyen por todo el volumen disponible. Los estados en los que una parte significativa del volumen disponible está vacía apenas afectan al número $S(E,V)$ en absoluto.
Pero en el extremo opuesto de un sistema con una sola partícula localizada en algún lugar dentro de un volumen de proporciones astronómicas, en lo que se refiere a los experimentos a escala de laboratorio con esa partícula, contar los eigenestados de energía ya no es algo útil, y definir el "trabajo" en términos de cambios en ese volumen es también prácticamente inútil. La definición de "trabajo" utilizada en el ejemplo 1 es más útil en este extremo, al menos si excluimos situaciones como la del ejemplo 2.
El mensaje aquí es que diferentes definiciones de trabajo son útiles en diferentes situaciones.
Ejemplo 4: Igualdad de Jarzynski (versión cuántica)
Con el fin de destacar cómo define el "trabajo", he aquí un rápido repaso de la versión cuántica de la igualdad de Jarzynski. Consideremos un sistema con un Hamiltoniano dependiente del tiempo $H(t)$ . Utiliza la imagen de Schrödinger, y deja que $\rho(t)$ denotan la matriz de densidad que representa el estado en el momento $t$ . Entonces $$ \rho(t) =u(t)\rho(0) u^\dagger(t) \tag{1} $$ con $$ \frac{d}{dt}u(t)=-iH(t)u(t) \hskip2cm u(0)=1. \tag{2} $$ (Utilizo minúsculas $u$ aquí por coherencia con el ejemplo 5.) Para cada $t$ , dejemos que $\mathcal{E}(t)$ denotan un conjunto completo de estados propios ortonormales de $H(t)$ y defina $$ E(t,k) := \langle k|H(t)|k\rangle \hskip1cm \text{for each} \hskip1cm |k\rangle\in\mathcal{E}(t) \tag{3} $$ y $$ Z(t) := \text{trace} \left(e^{-\beta H(t)} \right) = \sum_{|k\rangle\in\mathcal{E}(t)} e^{-\beta E(t,k)}. \tag{4} $$ Para simplificar, mantendré la temperatura inversa $\beta$ arreglado. Si el estado inicial es $$ \rho(0)=\frac{e^{-\beta H(0)}}{Z(0)}, \tag{5} $$ y si $H(t)$ se mide en $t=0$ y de nuevo en $t=1$ entonces la probabilidad conjunta de obtener los resultados $|j\rangle$ y $|k\rangle$ respectivamente, es $$ p(j,k) = \big|\langle k|u(1)|j\rangle\big|^2 \frac{e^{-\beta E(0,j)}}{Z(0)} \tag{6} $$ con $|j\rangle\in\mathcal{E}(0)$ y $|k\rangle\in\mathcal{E}(1)$ . En versión cuántica de la igualdad de Jarzynski dice $$ \sum_{j,k}p(j,k) e^{-\beta W(j,k)} = \frac{Z(1)}{Z(0)} \tag{7} $$ con $W(j,k) := E(1,k)-E(0,j)$ . La prueba es fácil: los factores $e^{\pm\beta E(0,j)}$ se anulan entre sí y, a continuación, se evalúa la suma sobre $j$ elimina la dependencia de $u(1)$ . La ecuación (7) es un caso especial de la ecuación (2.7) en Relaciones de Jarzynski para sistemas cuánticos y algunas aplicaciones .
Aunque la demostración es fácil, la ecuación (7) es interesante porque en el lado izquierdo interviene $u(1)$ lo que dice algo sobre cómo el sistema llega de $t=0$ a $t=1$ mientras que en el lado derecho sólo intervienen los hamiltonianos inicial y final $H(0)$ y $H(1)$ independientemente de lo que ocurra entre medias. Podemos hacerlo aún más interesante refiriéndonos a la cantidad $W(j,k)$ como "trabajo".
En el ejemplo 1, en el que $H(t)$ es independiente de $t$ esta definición de "trabajo" daría $$ \sum_{j,k}p(j,k)f\big(W(j,k)\big) = \sum_{j}p(j,j)f\big(W(j,j)\big)= f(0), $$ para cualquier función $f$ y para cualquier estado inicial (no sólo para un estado térmico), por lo que esta definición de trabajo es no equivalente a la definición que utilizaríamos normalmente en un contexto como el del ejemplo 1. Una vez más, las distintas definiciones de trabajo son útiles en situaciones diferentes.
Ejemplo 5: Contabilización de la reacción contraria
La OP considera un Hamiltoniano dependiente del tiempo $H(t)$ lo que hacemos a menudo para tener en cuenta cómo los dispositivos externos afectan al sistema de interés cuando la reacción es insignificante. En el documento Relaciones de fluctuación y desigualdades fuertes para sistemas térmicamente aislados Jarzynski reconoce las limitaciones de este modelo:
Es difícil imaginar una situación experimental en la que un sistema cuántico macroscópico esté tan completamente aislado de su entorno que evolucione unitariamente al variar un parámetro externo de un valor a otro... seguramente un fotón o una molécula de gas caprichosos se dispersarán por el sistema, estropeando la unitariedad. ... Estas consideraciones ponen de relieve las idealizaciones que se hacen (y que deben tenerse siempre presentes) al elegir ecuaciones dinámicas de movimiento específicas para modelizar la evolución de un sistema de muchas partículas.
Para tener en cuenta la reacción a posteriori, podemos utilizar un modelo más realista que incluya la dinámica cuántica microscópica de cualquier dispositivo que esté afectando al subsistema de interés, junto con el propio subsistema de interés, todo ello como parte de un gran sistema realmente cerrado con un tiempo global de en Hamiltoniano dependiente $H$ . Un modelo de este tipo incluye automáticamente la reacción contraria: $H$ es independiente del tiempo, por lo que la energía total se conserva. Sin embargo, esto no hace que el "trabajo" sea inequívoco. Por el contrario, expone una ambigüedad más profunda.
Un ejemplo de este modelo es QED + QCD (electrodinámica cuántica combinada con cromodinámica cuántica), que es lo suficientemente rico como para dar cuenta de la dinámica molecular y nuclear de la mayoría de los experimentos a escala de laboratorio que podrían asociarse con la igualdad de Jarzynski. En QED+QCD, ¿qué parte de la energía total del sistema utilizaríamos para definir el trabajo realizado en el subsistema de interés? La respuesta depende del estado, porque el estado define qué objetos están presentes, qué equipo de laboratorio está presente y cómo está configurado todo, tanto macroscópica como microscópicamente. Incluso en el contexto de un estado dado, el concepto de "energía" de un subsistema es fundamentalmente ambiguo. El Hamiltoniano de QED+QCD implica un campo de electrones, un y así sucesivamente, y todos los objetos y equipos de laboratorio y moléculas de aire se describen en términos de estos mismos campos cuánticos. En QED+QCD, no existe una forma general o perfecta de separar la energía de un subsistema de la energía del resto del mundo.
La dificultad no se limita a QED+QCD. Para formularla en términos generales, considérese cualquier sistema cuántico con un tiempo- en Hamiltoniano dependiente $H$ . En la imagen de Schrödinger, que estoy utilizando aquí, el modelo se define por su conjunto $\Omega$ de observables independientes del tiempo, junto con el Hamiltoniano $H$ que genera la evolución temporal. A subsistema es un subconjunto simple $\omega\subset\Omega$ .
(Una definición menos general pero más popular de "subsistema" implica escribir el espacio de Hilbert $\cal{H}$ como producto tensorial $\cal{H}=\cal{H}_1\otimes\cal{H}_2$ y tomando $\omega$ para ser todos los observables en $\Omega$ que actúan de forma no trivial sólo sobre un factor $\cal{H}_1$ .)
Definición de la estado del subsistema es trivial. Sea $$ \psi(\cdots,t) := \frac{ \big\langle\psi(t)\,\big|\cdots\big|\,\psi(t)\big\rangle }{ \big\langle\psi(t)\,\big|\,\psi(t)\big\rangle} \tag{8} $$ sea el estado del sistema completo en el momento $t$ . Los puntos " $\cdots$ "son un marcador de posición para un operador: si $X$ es un observable, entonces $\psi(X,t)$ es el valor esperado de $X$ a la vez $t$ . El Hamiltoniano $H$ entra a través de la relación $$ \psi(\cdots,t) = \psi\big(U^\dagger(t)\cdots U(t),0\big) \tag{9} $$ con los operadores unitarios $U(t)$ definido por $$ \frac{d}{dt} U(t)=-iH\,U(t). \tag{10} $$ En estado del subsistema $\omega\subset\Omega$ a la vez $t$ es simplemente la restricción de la función $\psi(\cdots,t)$ a observables en $\omega$ . No es necesario factorizar el espacio de Hilbert, ni tomar una "traza parcial", ni nada por el estilo. Esas pueden ser herramientas útiles para los cálculos, pero no son necesarias conceptualmente.
La ecuación (7) se refiere al Hamiltoniano del subsistema. ¿Qué significa esto en el marco general? ¿Cuándo actúa un subsistema como si tuviera un Hamiltoniano propio (posiblemente dependiente del tiempo)? Probablemente se trate de una pregunta lo bastante importante como para llenar varias carreras de investigación, así que no intentaré responderla aquí, pero sugeriré una forma de formularla. La pregunta se refiere a la viabilidad de una aproximación $$ \psi(X,t)\approx\psi\big(u^\dagger(t)X u(t),0\big) \hskip1cm \text{for all } X\in\omega\subset\Omega, \tag{11} $$ con operadores unitarios $u(t)$ dada por (2) para algún Hamiltoniano dependiente del tiempo $H(t)$ que conmuta con todo lo que conmuta con todo en $\omega$ . En otras palabras, queremos $H(t)$ pertenecer a la conmutante doble de $\omega$ . En otras palabras, queremos $H(t)$ pertenecer a la álgebra de von Neumann generado por $\omega$ .
Si podemos encontrar un $H(t)$ entonces podemos utilizarla para definir la energía del subsistema, que es un requisito previo para definir el "trabajo". En general, no tenemos ninguna garantía de que tal $H(t)$ existe, pero al menos tenemos una formulación matemática de la cuestión.
La ecuación (7) supone que el sistema se encuentra inicialmente en un estado térmico (5). ¿Cómo podemos expresar una condición inicial como (5) en el marco general? Una forma sería utilizar la aproximación (11) para justificar la vuelta a un modelo sin reacción de retroceso, pero eso frustraría el propósito de utilizar el marco más general.
Aquí tienes otra forma: Supongamos que $H(t)$ satisface las condiciones mostradas anteriormente, y para simplificar el lenguaje y la notación, supongamos que su espectro es discreto. Sea $P(t,k)$ sea el operador de proyección sobre el vector propio $|k\rangle$ de $H(t)$ con valor propio $E(t,k)$ . Entonces una condición inicial como (5) puede expresarse así: $$ \psi\big(P(0,k),0\big) \propto e^{-\beta E(0,k)} \tag{12} $$ con un factor de proporcionalidad independiente de $k$ . Por construcción, los operadores de proyección $P(t,k)$ pertenecen al álgebra de von Neumann generada por $\omega$ por lo que la condición (12) describe el estado del subsistema sin suponer nada más sobre el estado del sistema completo.
Las ecuaciones (8)-(11) proporcionarían un enfoque general para tener en cuenta la reacción de retroceso, pero todo depende de la identificación del subsistema de interés como un subconjunto $\omega\subset\Omega$ de los observables del sistema. Pensando en el ejemplo QED+QCD queda claro que en general, no existe una definición de "subsistema" independiente del Estado . Sin tener en cuenta las ambigüedades sobre cómo definir el subsistema de energía que, por supuesto, es un requisito previo para definir "trabajo". Aquí tenemos una ambigüedad mucho más profunda: el propio concepto de "subsistema de interés" depende del estado, porque la existencia y la configuración de todo el experimento dependen del estado. En la teoría cuántica relativista de campos, los observables no están ligados a las partículas, porque las partículas son sólo fenómenos. Los observables están ligados a regiones del espacio (o espaciotiempo en la imagen de Heisenberg). Esto supone un profundo obstáculo para la existencia de cualquier definición de "trabajo" que se comporte como se desea en sistemas cuánticos arbitrarios.