Yo no soy una autoridad en esta área y no creo que lo que tengo que decir es particularmente profunda. Sólo un par de pensamientos que tuve al leer tu pregunta.
En todo lo que sigue me referiré a los campos libres.
El real escalar campo tiene una única representación espacial, porque sólo hay una polarización y una carga, que puede ser visto por la realización de $|\vec{p}\rangle$ únicamente las etiquetas de una partícula de estados (Fourier-la transformación de los da $|\vec{x}\rangle$, con una fase de factor).
El complejo de escalar el campo no tiene una única representación espacial, ya que, aunque sólo hay una polarización, hay dos cargos (que podemos distinguir en la cuantización canónica mediante la introducción de separar los operadores de creación y aniquilación $\hat{a}/\hat{a}^{\dagger}$$\hat{b}/\hat{b}^{\dagger}$). Esto puede ser visto doblemente por de nuevo al darse cuenta de que el correcto partícula de los estados deben también tiene una especie de etiqueta, decir $|\vec{p},\pm\rangle$. La representación espacial también debe llevar una etiqueta, es decir,$|\vec{x},\pm\rangle$.
Usted puede ver cómo esta lógica va a llevar a la spinor caso. Un campo de Dirac tiene dos cargos y, para cada cargo, dos estados de polarización.
Así que cuando usted se pregunte:
"¿qué significa para multiplicar un ket vector por un 4-componente de spinor?"
esto significa que usted conseguirá un componente de cuatro objeto en la final, a saber:
$$\begin{align}
\psi(x)|0\rangle&=\sum_{s=1}^2 \int \frac{d^3p}{(2\pi)^3}\bigg[\require{cancel}\cancel{(b^s_p|0\rangle)}u^s(p)e^{-ip\cdot x}+(c_p^{s \dagger}|0\rangle)v^s(p)e^{-ip\cdot x} \bigg]\\
&=\sum_{s=1}^2 \int \frac{d^3p}{(2\pi)^3}\bigg[v^s(p)e^{-ip\cdot x} \bigg]|\vec{p},s,+\rangle \\
\end{align}$$
y ahora usted puede pedir su proyección en $|\vec{x},s,+\rangle$ o menos útil, pero más decididamente $|\vec{x},i\rangle$ donde $i$ es uno de los componentes de la Dirac campo, etc.. Cómo estos estados y sus proyecciones a lo largo de $|\vec{p},s,\pm\rangle$ son definidas realmente, no lo sé, pero estoy seguro de que alguien aquí. Sin embargo, se puede ver que necesitamos para incorporar los diferentes polarizaciones y cargos de $(s,\pm)$ en nuestras definiciones de estado-proyecciones, en contraste con el real escalar campo donde teníamos:
$$<\vec{x}|\vec{k}>=e^{-i\vec{k}\cdot\vec{x}}$$
Si tuviera que adivinar, de forma coherente, para definir $\langle \vec{x},s',r'|\vec{p},s,r\rangle$, sería simplemente:
$$\langle \vec{x},s',r'|\vec{p},s,r\rangle=\delta_{s,s'}\delta_{r,r'} e^{-i\vec{k}\cdot\vec{x}}$$