No solo acoplados, sino fuertemente acoplados; estos efectos de acoplamiento tienden a observarse cuando la constante de acoplamiento $J$ está en el orden de $\Delta \nu$ (diferencia en frecuencias de resonancia entre los dos espines).
El origen es de naturaleza cuántica. Intentaré dar una descripción simplificada de lo que sucede sin entrar en detalles explícitos. Para un par de núcleos acoplados de espín 1/2, etiquetados como 1 y 2, el hamiltoniano en un campo magnético es
$$\hat{H} = \omega_1\hat{I}_{\!1z} + \omega_2\hat{I}_{\!2z} + 2\pi J(\vec{I}_{\!1}\cdot\vec{I}_{\!2})$$
Si los espines no están acoplados en absoluto, entonces
$$\hat{H} = \omega_1\hat{I}_{\!1z} + \omega_2\hat{I}_{\!2z}$$
$$\begin{array}{ccc} \text{Función propia} & \text{Valor de }m_1 & \text{Valor de }m_2 \\ \hline |\alpha\alpha\rangle & +1/2 & +1/2 \\ |\alpha\beta\rangle & +1/2 & -1/2 \\ |\beta\alpha\rangle & -1/2 & +1/2 \\ |\beta\beta\rangle & -1/2 & -1/2 \end{array}$$
La teoría de RMN indica que solo las transiciones con $\Delta M = \pm 1$ son observables, donde $M$ es la suma de los números cuánticos $m_1$ y $m_2$. Por ejemplo, $|\alpha\alpha\rangle \leftrightarrow |\alpha\beta\rangle$ es una transición observable ($\Delta M = \pm 1$), pero $|\alpha\alpha\rangle \leftrightarrow |\beta\beta\rangle$ es no observable ($\Delta M = \pm 2$). A partir de la tabla anterior se puede ver que hay cuatro transiciones observables:
$$|\alpha\alpha\rangle \leftrightarrow |\alpha\beta\rangle; |\alpha\alpha\rangle \leftrightarrow |\beta\alpha\rangle; |\alpha\beta\rangle \leftrightarrow |\beta\beta\rangle; |\beta\alpha\rangle \leftrightarrow |\beta\beta\rangle$$
Cada transición corresponde a una energía fija, y por lo tanto cada transición observable da lugar a un pico en el espectro de RMN. El área bajo el pico, o hablando coloquialmente, la altura del pico, está relacionada con cuánto de "$\Delta M = \pm 1$" carácter hay en cada transición. Por supuesto, hay una manera de formalizar esto, pero por simplicidad eso tendrá que omitirse.
Para la transición $|\alpha\alpha\rangle \leftrightarrow |\beta\beta\rangle$, esto es totalmente $\Delta M = \pm 2$. Entonces, la cantidad de "carácter $\Delta M = \pm 1$" es exactamente cero, y la transición es completamente no observable.
Por otro lado, para las cuatro transiciones permitidas, la cantidad de "carácter $\Delta M = \pm 1$" es exactamente uno, y por lo tanto todas las transiciones tienen la misma intensidad. [Por supuesto, debido a la falta de acoplamiento, habrá dos pares degenerados (es decir, hay dos pares de transiciones con la misma energía), y así obtienes dos singletes en el espectro.]
Ahora, a medida que el término de acoplamiento $2\pi J(\vec{I}_{\!1}\cdot\vec{I}_{\!2})$ se hace más y más grande, las funciones propias se desplazan gradualmente lejos de estas. Estas se pueden expresar en términos de combinaciones lineales de las cuatro funciones propias originales. Sin demostrar presentaré los resultados
$$\begin{array}{cc} \text{Nueva función propia} & \text{Expresión en términos de funciones propias antiguas} \\ \hline |1\rangle & |\alpha\alpha\rangle \\ |2\rangle & \cos\theta|\alpha\beta\rangle + \sin\theta|\beta\alpha\rangle \\ |3\rangle & -\sin\theta|\alpha\beta\rangle + \cos\theta|\beta\alpha\rangle \\ |4\rangle & |\beta\beta\rangle \end{array}$$
donde $\theta$ está definido por $\tan(2\theta) \equiv J/\Delta\nu$. A medida que la razón de $J$ a $\Delta\nu$ va de cero a infinito, $\theta$ va de $0$ a $\pi/4$. Es fácil verificar que la desviación de las antiguas funciones propias aumenta a medida que esta razón $J/\Delta\nu$ aumenta.
Veamos la transición $|1\rangle \leftrightarrow |2\rangle$. ¿Cuánto "carácter $\Delta M = \pm 1$" hay aquí? Dado que $|2\rangle$ es una mezcla de $|\alpha\beta\rangle$ y $|\beta\alpha\rangle$ la transición $|1\rangle \leftrightarrow |2\rangle$ puede considerarse como una "mezcla" de $|\alpha\alpha\rangle \leftrightarrow |\alpha\beta\rangle$ y $|\alpha\alpha\rangle \leftrightarrow |\beta\alpha\rangle$.
Entonces, hay una cantidad $\cos\theta$ de "carácter $\Delta M = \pm 1$" que surge de la contribución $|\alpha\alpha\rangle \leftrightarrow |\alpha\beta\rangle$; y también hay una cantidad $\sin\theta$ de "carácter $\Delta M = \pm 1$" de la contribución $|\alpha\alpha\rangle \leftrightarrow |\beta\alpha\rangle$, para un total de $\cos\theta + \sin\theta$.
Por razones cuánticas es necesario elevar al cuadrado esta cantidad, es decir,
$$\begin{align} (\cos\theta + \sin\theta)^2 &= \cos^2\theta + \sin^2\theta + 2\sin\theta\cos\theta \\ &= 1 + \sin(2\theta) \end{align}$$
y al trabajar a través de la lista de transiciones, se encuentra que la cantidad de "carácter $\Delta M = \pm 1$" para cada transición es
$$\begin{array}{cc} \text{Transición} & \text{Cantidad de “}\Delta M = \pm 1\text{ carácter"} \\ \hline |1\rangle \leftrightarrow |2\rangle & 1 + \sin(2\theta) \\ |1\rangle \leftrightarrow |3\rangle & 1 - \sin(2\theta) \\ |2\rangle \leftrightarrow |4\rangle & 1 + \sin(2\theta) \\ |3\rangle \leftrightarrow |4\rangle & 1 - \sin(2\theta) \end{array}$$
¡Ajá! Entonces, siempre que $2\theta = \tan^{-1}(J/\Delta\nu) \neq 0$, las intensidades de los picos serán diferentes. Habrá dos picos fuertes (los que tienen signos positivos) y dos picos más débiles (los signos negativos).
Cuando la razón $J/\Delta\nu$ es pequeña, es decir, el límite de acoplamiento débil, entonces $\sin(2\theta)$ es pequeño y la diferencia en intensidad apenas se nota - no es algo que se pueda percibir a simple vista. Por ejemplo, en un espectrómetro de $\pu{400 MHz}$, dos protones que tienen una diferencia de desplazamiento químico de $\pu{1 ppm}$ tendrían $\Delta \nu = \pu{400 Hz}$. Si tomamos $J = \pu{7 Hz}$, entonces $2\theta = \tan^{-1}(7/400) = \pu{0.0175 rad}$ y tenemos $\sin(2\theta) = 0.0175$, una diferencia que sería difícil de detectar!
Pero cuando esta razón aumenta, el valor de $\sin(2\theta)$ aumentará, y la diferencia en intensidad se hará más evidente. No entraré en las matemáticas, pero es posible mostrar que las dos del medio transiciones tienen mayor intensidad, y las dos de afuera transiciones tienen menor intensidad - lo cual, por supuesto, da lugar al "efecto de tejado" del que hablas.