7 votos

Supuestos del documento de Heisenberg de 1925

No tengo del todo claro en qué se basan las suposiciones de Heisenberg en su artículo de 1925. Afirma que no se pueden considerar relaciones entre cantidades que son inobservables "en principio", como la posición y el periodo de revolución de un electrón.

Citando algún texto : "Estas reglas (las relaciones mencionadas) carecen de un fundamento físico evidente, a menos que se quiera mantener la esperanza de que las cantidades hasta ahora inobservables puedan entrar más tarde en el ámbito de la determinación experimental.

Esta esperanza podría estar justificada si tales reglas fueran internamente consistentes y aplicables a una gama claramente definida de problemas de mecánica cuántica."

Mi primera pregunta es ¿por qué afirma que la posición y el periodo de un electrón son inobservables "en principio"? Teóricamente no había ninguna razón (en aquella época) para dudar de que estas cantidades pudieran medirse, aunque ciertamente eran indeterminadas en la práctica.

En segundo lugar, el hecho de que una teoría que se ocupe de esas cantidades sea incoherente, o no sea lo suficientemente general, ¿por qué implica que no podamos definir o medir las cantidades de las que se ocupa esa teoría? Podemos ser capaces de medir perfectamente algunas cantidades, pero seguir formulando una teoría incorrecta en torno a ellas.

Por último, ¿existe alguna base ad hoc para decidir cuáles son esas cantidades "inciertas"? Más concretamente, ¿cómo pudo Heisenberg señalar la posición de un electrón como un parámetro incierto y no cualquier otra cantidad (como algún campo eléctrico, etc.)?

Gracias de antemano. (por cierto estoy estudiando el documento original únicamente para ver más de cerca la motivación de los supuestos que subyacen a la teoría)

6voto

heathrow Puntos 25

El artículo de Heisenberg deriva sus resultados a partir de una suposición que sólo se enuncia de forma oblicua en el artículo, y que es fundamental para todas las conclusiones. Esta suposición se explica más claramente en Wikipedia.

Heisenberg se ocupa de la órbita de un electrón en el átomo. Supongamos que esta órbita es precisa, de modo que el electrón tiene una posición en la m-ésima órbita de Bohr en función del tiempo es $X_m(t)$ . El movimiento es periódico, por lo que se puede transformar de Fourier este movimiento para obtener una serie de Fourier para la posición del electrón

$$ X(t) = \sum_n e^{in\omega t} X_{mn} $$

La cantidad $X_{mn}$ es el n-ésimo coeficiente de Fourier de la m-ésima órbita de Bohr. Esta cantidad está asociada a la frecuencia $n\omega$ donde $\omega=2\pi/T$ es la frecuencia de la órbita clásica (en radianes) y T es el período orbital clásico. Obsérvese que las frecuencias clásicas de Fourier son múltiplos de un mínimo común múltiplo, que es ( $2\pi$ veces) el período recíproco.

La razón fundamental por la que Heisenberg rechaza esta descripción (muy cercana a la idea original de Bohr, y desarrollada por Kramers y Heisenberg) es el hecho de que estas frecuencias espaciadas enteras $n\omega$ son no se observa en las transiciones atómicas .

las frecuencias que sí se observan son las frecuencias cuánticas, que son la diferencia de energía entre la n-ésima órbita de Bohr y la m-ésima órbita de Bohr. Hay un desajuste fundamental entre la descripción orbital clásica con su torre de frecuencias enteras y la emisión de ondas electromagnéticas observada del átomo, que tiene una colección de frecuencias no enteras completamente diferente.

Las frecuencias cuánticas vienen dadas por $E_n - E_m$ la diferencia de energía de la n-ésima y la m-ésima órbita, que sin embargo se convierten en enteros cuando n y m son grandes. En este límite, llamado límite de correspondencia, $E_n - E_m = {\partial E\over \partial J} (n-m)$ donde la derivada parcial es de la energía clásica con respecto a la variable de acción clásica J.

Así que en el límite de correspondencia, la descripción de la órbita clásica es válida, porque las frecuencias que se observan en las transiciones atómicas coinciden con las frecuencias que se deducirían al transformar de Fourier una órbita clásica aguda.

¿Pero qué pasa con los números cuánticos más pequeños? Aquí Heisenberg hace una suposición radicalmente nueva. Toma las cantidades $X_{nm}$ que son el n-ésimo coeficiente de Fourier de la m-ésima órbita de Bohr, y dice que aparecen en la mecánica cuántica con la frecuencia $E_n - E_m$ , no con la frecuencia $2\pi n \over T$ ¡! Esta idea ya está presente en Bohr en cierta medida, incluso en 1913 Bohr afirma que la transición de la órbita n a la órbita m debe corresponder a la componente clásica de Fourier del movimiento de alguna manera, pero Bohr no desarrolla esta idea completamente, dejándola vaga.

Heisenberg afirma entonces que si X_{nm} son quantum coeficientes de Fourier, entonces es inmediato que su desarrollo temporal debe ser

$$ X_{nm}(t) = e^{i (E_n - E_m) t} X_{nm}(0) $$

Aquí se puede reconocer la ecuación de movimiento de Heisenberg para los elementos de la matriz de X. Esto es requerido por el principio de correspondencia, para que coincida con la frecuencia de los coeficientes clásicos de Fourier para órbitas grandes. También es incompatible con la imagen de las órbitas agudas, porque los elementos de la matriz de X ya no forman torres de espacio entero que puedan utilizarse para reconstruir una órbita clásica periódica. Además, los coeficientes con frecuencias opuestas son conjugados complejos entre sí $X_{mn} = X_{nm}^*$ en la imagen clásica, sería $X_{m,n} = X_{m,-n}^*$ .

Parte de la diferencia es un desplazamiento trivial: el punto clásico n=0 se desplaza a n=m en la descripción matricial, simplemente porque la parte cercana a la diagonal es el movimiento clásico, no la columna 0. Este desplazamiento se expresa mediante la regla de correspondencia que $X^{\mathrm{cl}}_{m,n} = X_{m(m+n)}$ donde el lado izquierdo son los coeficientes clásicos de Fourier, y el lado derecho son los elementos de la matriz cuántica. Pero incluso con este desplazamiento, las relaciones de conjugación están fuera de lugar.

La conjugación compleja en QM refleja a lo largo de la diagonal de la matriz, no refleja la fila horizontal a lo largo de una línea vertical que corre por el centro. Se puede ver cómo surge el límite clásico si se observa el gran m,m+p en la matriz, El reflejo a m+p,m está a p unidades de la diagonal a la izquierda, mientras que la posición original está a p unidades a la derecha. Así que cuando las filas se vuelven continuas y las columnas se mantienen discretas, las relaciones de conjugación compleja reproducen las de la mecánica clásica en los coeficientes de Fourier.

Pero las cosas no están del todo bien, porque lo que está a la izquierda del punto medio en una fila determinada no es el conjugado complejo de la derecha. Esto significa que si tratas de escribir la órbita clásica en función del tiempo, fracasarás, produciendo cantidades complejas que no son periódicas, sino un sinsentido.

Es importante ver la intuición de Heisenberg aquí estaba seguro de que el quantum $X_mn$ es una descripción completa del movimiento cuántico, pero no incluye las órbitas clásicas. Su convicción es que la órbita no formaba parte de la descripción, que era una idea clásica redundante que ya no era útil, y el hecho de que su descripción no permitiera reproducir la órbita era un signo positivo, no una incompletud.

Otras cosas en el periódico

El siguiente paso es derivar la ley de multiplicación. Esto se explica en Wikipedia, pero es bastante obvio a partir de la ley clásica para multiplicar series de Fourier por convolución. El resultado es la multiplicación matricial.

Heisenberg deriva entonces la parte on-diagonal de las relaciones de conmutación canónicas a partir de algunas complicadas reglas de suma de radiación que hizo con Kramers. La derivación en Wikipedia es más elemental, pero utiliza esencialmente los mismos ingredientes, sin depender de las reglas de suma de Kramers-Heisenberg, y sin hacer trucos ad-hoc como diferenciar con respecto a n. La derivación de la relación de conmutación canónica on-diagonal es el principal obstáculo que hace que este documento sea mágico - es difícil de seguir, hay que hacerlo de una manera diferente hoy en día.

¿Por qué la incertidumbre?

El principio de incertidumbre, aunque sólo se formuló explícitamente en 1927, ya está presente en 1925 en gran medida, salvo que no se enuncia en términos de variables complementarias.

Las matrices de Heisenberg sólo permiten reconstruir una órbita difusa, sólo es una órbita periódica clásica en la medida en que las frecuencias son enteras. Así pues, para Heisenberg, las cantidades que son "inciertas" no lo son todavía en un sentido estadístico (eso viene después, tras la interpretación de Born de la función de onda), pero son inciertas en el sentido de que no pueden reconstruirse en un sistema cuántico.

Heisenberg habría dicho que el momento también es incierto, porque la serie de fourier del momento no puede reconstruirse a partir de los elementos de la matriz de P. La energía sería cierta, porque los niveles de energía son precisos en la descripción (ignorando la reacción de retorno de las emisiones del campo EM).

Esto es un artefacto del hecho de que Heisenberg trabajaba en el espacio de frecuencias, por lo que el hamiltoniano era diagonal. En esta imagen, toda cantidad que no conmute con H se consideraría incierta, porque necesariamente tendría elementos matriciales no diagonales que no permiten reconstruir su variación temporal con precisión.

Este concepto de incertidumbre no es el mismo que el de 1927, que llegó después de que los desarrollos posteriores aclararan la noción de estado. En 1925, Heisenberg no estaba seguro de cómo describir el estado, sólo podía describir los análogos del movimiento clásico en las órbitas de Bohr.

Por lo tanto, la noción de borrosidad de la cantidad en el documento de 1925 debe considerarse como una mala definición de la cantidad clásica en función del tiempo, no como una afirmación estadística sobre los valores de la observación de esa cantidad (al menos no todavía).

4voto

Nick Puntos 583

Mi primera pregunta es ¿por qué afirma que la posición y el periodo de un electrón son inobservables "en principio"? Teóricamente no había ninguna razón (en aquella época) para dudar de que estas cantidades pudieran medirse, aunque ciertamente eran indeterminadas en la práctica.

Evidentemente, Werner Heisenberg no estaba de acuerdo con esta suposición suya y dio la casualidad de que su capacidad de discrepar le convirtió en fundador de la mecánica cuántica.

Ha pasado varios años intentando desarrollar modelos "planetarios cuantizados" del átomo de helio, etc., antes de comprender que este proyecto fracasa por razones fundamentales. Tal helio con posiciones bien definidas sería descrito por un problema caótico de 3 cuerpos y no habría manera de que fuera consistente con el comportamiento regular conocido del átomo de helio (y otros átomos y otros sistemas coherentes), incluyendo las líneas espectrales agudas.

Así que Heisenberg fue capaz de ver en 1925 algo que no se puede ver ahora: que los electrones no pueden seguir ninguna trayectoria concreta mientras están en los átomos. En cambio, lo que se observa es que tienen una energía totalmente definida de una lista posible, el espectro -algo que podemos observar realmente a través de los fotones que los átomos emiten o absorben. Para llegar a la conclusión de que los electrones no pueden seguir trayectorias clásicas particulares en los átomos, no tuvo que esperar a que los aparatos de medición fueran lo suficientemente precisos. Fue capaz de llegar a esta conclusión a partir de los datos disponibles por "puro pensamiento", y estaba en lo cierto.

En segundo lugar, el hecho de que una teoría que se ocupe de esas cantidades sea incoherente, o no sea lo suficientemente general, ¿por qué implica que no podamos definir o medir las cantidades de las que se ocupa esa teoría? Podemos ser capaces de medir perfectamente algunas cantidades, pero seguir formulando una teoría incorrecta en torno a ellas.

Muchas combinaciones de opciones serían posibles en un mundo hipotético genérico y tienes razón en que la combinación de opciones que has mencionado sería lógicamente posible en otro mundo, pero Heisenberg estaba hablando de nuestro mundo. Aprendió su mensaje de la relatividad especial de que no se debe hablar de cosas que no se pueden definir operacionalmente - como la simultaneidad de eventos (que depende del observador) y trató de aplicar al máximo este modo de razonamiento positivista al mundo de los átomos. Su análisis le dictó que puede suponer que el electrón del átomo tiene una energía determinada durante mucho tiempo, pero no puede tener una posición o velocidad bien definidas. Así que reformuló la física en torno a la noción de la energía que es medible y descubrió la primera formulación de la mecánica cuántica en la imagen de Heisenberg basada en los estados propios de energía.

Por último, ¿existe alguna base ad hoc para decidir cuáles son estas cantidades "inciertas"? Más concretamente, ¿cómo pudo Heisenberg señalar la posición de un electrón como un parámetro incierto y no cualquier otra cantidad (como algún campo eléctrico, etc.)?

Estás mezclando manzanas con naranjas aquí. El artículo de Heisenberg no hablaba del campo electromagnético. Hablaba del marco lógico general que subyace a la física y los ejemplos que tomó fueron los de la mecánica -rotador rígido y oscilador anarmónico- que se pretendía generalizar más tarde a una teoría de los átomos en particular sólo por una nueva elección de la fórmula de energía potencial.

No hay ningún concepto observable de "campos eléctricos" en la descripción de un átomo u oscilador anarmónico. Incluso en la física clásica, se trata de funciones de posiciones y momentos. Se dio cuenta de que no todas las funciones son igualmente observables: la energía (una función particular de posiciones y momentos) es mucho más observable y estable.

La lógica subyacente que ha desarrollado se aplicó posteriormente (pronto) a otros sistemas de la mecánica, como los átomos y las moléculas, así como a la teoría de campos, como el electromagnetismo. Pero la esencia no está en describir qué grados de libertad hay (se mantienen lo más cerca posible de los de la teoría clásica correspondiente); la esencia de la mecánica cuántica está en el conjunto totalmente nuevo de postulados y métodos para hacer predicciones.

Se dio cuenta de que el objetivo correcto no era simplemente encontrar otra teoría clásica sólo con algunos nuevos grados de libertad, que es la suposición intrínseca, fundamental y completamente errónea de toda su cuestión desde el principio hasta el final. Se dio cuenta de que los nuevos conocimientos obligan a los físicos a formular una teoría completamente nueva -y él (y otros) ya ha utilizado el término completamente nuevo de "teoría cuántica" para ello- y acaba de hacerlo, descubriendo algunas de las nuevas fórmulas cuánticas explícitas para predicciones no triviales (más allá del espectro del átomo de hidrógeno que se "explicaba" con el modelo de juguete de Bohr).

Se puede repetir muchas veces que no era necesaria una revolución conceptual completa en la física (pasar de lo clásico a lo cuántico) y que sólo se debería haber discutido sobre nuevos modelos clásicos con nuevas variables (sin prestar atención a si se pueden observar realmente o no), excepto que Heisenberg sabía que era necesario y los meses (y algunos años) que siguieron a su descubrimiento hicieron que su suposición fuera incuestionable.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X