Esta es una versión aproximada del resumen de la respuesta completa Lo publiqué en math.stackexchange, donde se discuten más detalles en una larga digresión, en particular las motivaciones matemáticas de tus puntos 1., 3. y 4. (Cualquier lector interesado en más explicaciones y una lista actualizada de referencias más larga debería consultar esa otra respuesta en Math.SE). Te recomiendo encarecidamente que leas con atención las maravillosas referencias siguientes:
Los sistemas están completamente descritos por las propiedades observables que tienen (o los grados de libertad disponibles para su medición o elegidos para ser descritos), propiedades que pueden no tener valores definidos simultáneamente. Esto se debe a que la observación de algunos aspectos de un sistema puede destruir/"indefinir" algunas de las propiedades anteriores, precisamente las que eran incompatibles con las nuevas. Por ejemplo, componer sucesivamente aparatos de Stern-Gerlach en diferentes ejes, permite medir las componentes de espín $S_z$ y $S_x$ pero tras el segundo filtro, una nueva medición del primero volverá a ser aleatoria, es decir, la propiedad observable "tener espín definido en la dirección __" no está definida simultáneamente para direcciones independientes: la medición de una hace que el sistema pierda su valor definido en la otra. Otro ejemplo es la posición y el momento lineal, que eran los grados de libertad conmutables del espacio de fases clásico. Los experimentos de mecánica cuántica, muy relacionados con la originalmente llamada "dualidad onda-partícula", determinaron que las funciones de onda de posición y momento (que miden las distribuciones de amplitud de probabilidad de posibles medidas) estaban relacionadas por una transformación de Fourier entre sí, lo que implicaba que su conmutador era $[\hat x,\hat p_x]=i\hbar$ por lo que se convirtieron en variables no conmutativas mejor estudiadas bajo álgebras de operadores.
Dado que clásicamente todos los observables son funciones en el espacio de fase, esto obliga al álgebra de observables generales a ser no conmutativa: el orden en que se miden los observables en sucesión puede no conmutar. Dado que cualquier medida física es numérica, en general de valor real, el álgebra no conmutativa encaja perfectamente en los operadores autoadjuntos de los espacios de Hilbert, porque son los únicos operadores unitariamente equivalentes a los operadores diagonales multiplicativos de espectro real. Dado que podemos considerar una propiedad observable como el conjunto de sus posibles valores, trabajar con álgebras de operadores permite codificar diferentes propiedades/observables en el álgebra mutua que definen. Así, determinamos experimentalmente qué conjuntos de observables conmutan, por lo que podemos hablar de conjuntos completos de operadores compatibles, que definen el estado del sistema completamente mediante una cadena de datos de valores propios (los valores reales de los parámetros/propiedades medidos). Tales cadenas posibles de valores propios para cada operador en un conjunto compatible definen un "estado del sistema en un momento dado", pero también definen vectores base de un espacio de Hilbert sobre el que actúan los operadores; por lo tanto, diferentes conjuntos de este tipo definen bases diferentes, de modo que si nuestro sistema viene dado por un vector propio común de una base, en general será una superposición lineal de los vectores propios de otra base, produciendo términos cruzados de interferencia en las probabilidades de transición de un estado a otro. Experimentalmente se ha comprobado que este enfoque es el correcto, ya que, además de la complementariedad, la otra característica cuántica principal es la superposición lineal de estados. Puesto que los valores propios son las propiedades observables del sistema, la superposición en otra base no tiene valores propios definidos de forma única y, por tanto, esas otras propiedades del sistema en ese estado no están bien definidas en ese momento. Dado que los eigenestados comunes pueden venir dados por operadores de proyección que se proyectan sobre los eigenespacios sucesivos, un estado puro del sistema puede venir dado por un rayo del espacio proyectivo de Hilbert o por un operador de proyección adecuado: cada operador de un conjunto conmutativo completo se expande por el teorema espectral como una suma de operadores de proyección ponderados por sus respectivos eigenvalores, donde los proyectores se proyectan sobre cada eigenvector común, y esa es la forma en que los operadores codifican tanto la lista de posibles valores medibles de una propiedad como su álgebra mutua. Entonces, uno puede formalizar la mecánica cuántica sólo con álgebras de operadores (donde entran cosas como las álgebras C* y Gel'fand-Naimark) y caracterizar qué operadores son observables y cuáles son estados puros, o estados mixtos si uno incluye incertidumbres en los estados iniciales de la preparación. En este sentido, se recupera la mecánica de imágenes/matrices de Heisenberg, en la que el estado no era más que la lista de valores observados para un conjunto elegido de dispositivos de medición compatibles, y los observables evolucionaban con el tiempo entre mediciones, de modo que se obtenía probabilísticamente un nuevo conjunto de valores para mayb
RESUMEN: Por tanto, los observables vienen dados por álgebras de operadores autoadjuntos porque son los que tienen espectros reales correspondientes a los posibles valores empíricos reales. Los subconjuntos máximos conmutables de los operadores son simultáneamente diagonalizables, es decir, representan observables compatibles que pueden medirse al mismo tiempo, por lo que el estado del sistema en cada observación se caracteriza por una lista de valores propios de este tipo. Esto define un espacio de Hilbert por superposición lineal sobre el que actúan los operadores: un observable tiene un valor definido si y sólo si el estado se encuentra en uno de sus vectores propios. Dado un eigenestado en una base elegida, la evolución unitaria en la imagen de Schrödinger mueve el vector en el espacio de Hilbert de modo que su componente proyectada a cualquier otro vector de base posible cambia, donde el módulo al cuadrado de esas componentes complejas del estado del vector actual sobre cualquier otro vector da la probabilidad de observar el segundo conjunto de eigenvalores en nuestras próximas mediciones dado el primer conjunto en nuestra medición inicial. Dado que estos componentes se dan en términos de productos escalares $(|\chi\rangle,\, |\psi\rangle)$ por el teorema de Riesz se pueden utilizar funciones lineales $\langle\chi|$ para actuar sobre los vectores y dar las amplitudes de transición deseadas; puesto que estos funcionales forman también un espacio lineal (dual), se puede pensar en ellos como posibles estados finales en nuestros cálculos. Sin embargo, los estados físicos no son más que una lista empírica de valores para cada grado de libertad observado del sistema; hay que tener en cuenta consideraciones metafísicas muy cuidadosas antes de dar significado a los estados intermedios, no observados, de superposición: correlacionan estadísticamente los estados observados en diferentes momentos, pero no se puede decir que el sistema tenga una superposición de sus propiedades. Como afirmaba Dirac La imagen de Heisenberg es la [empírica] correcta (¡nadie observa nunca superposiciones!).
Como dijo Asher Peres: " Los experimentos tienen lugar en un laboratorio, no en un espacio de Hilbert " y " los experimentos no realizados no tienen resultados ". Los problemas ontológicos y epistemológicos interpretativos del formalismo entran cuando se intenta pensar en él más allá de una postura empirista, atribuyendo realidad a partes del formalismo (por ejemplo, la superposición de gatos) que no pueden observarse experimentalmente (¿¡todavía!?) más allá del nivel estructural/correlacional. (Si te interesan estas cuestiones, te recomiendo que leas los artículos de Carlo Rovelli sobre la mecánica cuántica relacional, y todo lo relacionado con el formalismo de las historias consistentes/coherentes, además del libro de Isham que aparece arriba, para contrastar las referencias ortodoxas estándar con interpretaciones más cautelosas).