Para entender lo que sucede cuando podemos subir o bajar los índices, tenemos que ver lo que en realidad son los objetos que están en funcionamiento.
TL;DR - Se plantean (inferior) componentes de los vectores (vectores duales), no su base.
Para ver por qué los derivados se utilizan como base, se utiliza la siguiente motivación:
Imaginar una curva en algún lugar de $\mathbf{R}^3$. La curva tendrá un vector tangente en cada uno de sus puntos. Si denotamos la curva de $r(\lambda)$ (una función) con $\lambda$ el parámetro de curva, el vector tangente se $$\mathbf{t} = \frac{d\mathbf{r}(\lambda)}{d\lambda} = \sum\frac{dx^i}{d\lambda}\hat{x}^i$$
Así que ahora sabemos que la "tasa y la dirección del cambio" de la curva, en un punto de $r(\lambda)$.
Hemos ganado un vector, y nos gustaría utilizar este vector para describir otras cosas que están pasando más que el colector.
La siguiente pregunta que nos hacemos es ¿cuál es la tasa de cambio de algún otro objeto en la dirección del primer vector. Bien, todavía estamos en el $\mathbf{R}^3$, así que sabemos cómo encontrar esas "tasas de cambio" - el operador nabla $\nabla = \frac{\partial}{\partial x} \hat{x} + \frac{\partial}{\partial y} \hat{y} + \frac{\partial}{\partial z} \hat{z}$. Para encontrar la tasa de cambio en la dirección de la previamente adquirida vector, se proyecto la $\nabla$ $\mathbf{t}$
$$\mathbf{t}\nabla = \sum \frac{dx^i}{d\lambda}\frac{\partial}{\partial x^i}$$ Aquí podemos ver que mediante el uso de vectores tangente, podemos sonda y obtener información acerca de las tasas de cambio de los objetos en ciertas direcciones.
Ahora, si hacemos uso de esta motivación, que los vectores que, al actuar sobre algunos objetos, nos dan información acerca de algunos de tasa de cambio, se puede construir una base de vectores tangente $\mathbf{R}^3$ $\{ \frac{\partial}{\partial x} , \frac{\partial}{\partial y}, \frac{\partial}{\partial z} \}$
Podemos demostrar que la base puede ser construida a lo largo de cada punto de un colector general, short-handed escrito $\{\partial_\mu\equiv\frac{\partial}{\partial x^\mu}\}$.
Vectores fueron construidos como objetos actuando en funciones, y también hay objetos que actúan sobre vectores y enviarlos a los números reales, llamados vectores duales. De nuevo, por el dibujo de la motivación de $\mathbf{R}^3$, se puede construir una base para estos dos vectores, y se denota esta base como $\{ dx^\mu\}$, en base a esto se define por la forma en que actúa sobre el vector de la base: $$dx^\mu(\partial_\nu) = \delta^\mu_\nu$$
Ahora viene uno de los puntos clave donde el error ocurrió - hemos definido una base de vectores, y un vector es un objeto como $u = u^\mu\partial_\mu$. Por ejemplo, podemos construir un vector $v=1\cdot\partial_1$. Por lo tanto, aquí el número 1 es un vector de componentes, mientras que $\partial_1$ es el componente de la base. Como un ejemplo, un vector dual debería ser escrita como $\omega = \omega_\nu dx^\nu$.
Vectores y vectores duales tienen una relación especial, un vector dual $\omega$ actúa sobre un vector $v$ y la envía a un número real.
Podemos expresar esta el uso de sus bases.
$$\omega(v) = \omega_\mu dx^\mu v^\nu\partial_\nu=\omega_\mu v^\nu dx^\mu\partial_\nu = \omega_\mu v^\nu\delta^\mu_\nu = \omega_\mu v^\mu$$
Ahora llegamos a la métrica del tensor. Un tensor es un objeto que actúa en un cierto número de vectores y vectores duales, en función del tensor de tipo. Un tensor métrico es un tensor que actúa sobre dos vectores.
Podemos escribir el tensor métrico utilizando previamente definido bases como:
$$g = g_{\mu\nu}dx^\mu \otimes dx^\nu$$
Por lo tanto la acción de un tensor métrico, es decir, se necesitan dos vectores como una entrada y salidas de un número real. Escrito completamente en la base, esto es:
$$g(u, v) = g_{\mu\nu}dx^\mu(u^\alpha \partial_\alpha) \otimes dx^\nu (v^\beta \partial_\beta)$$
$$g(u, v) = g_{\mu\nu}u^\alpha v^\beta dx^\mu (\partial_\alpha) dx^\nu(\partial_\beta)$$
$$g(u, v) = g_{\mu\nu}u^\alpha v^\beta \delta^\mu_\alpha \delta^\nu_\beta = g_{\mu\nu}u^\mu v^\nu$$
Esta operación tiene una notación corta
$$g_{\mu\nu}u^\mu v^\nu = u_\nu v^\nu$$
y sólo aquí es donde el bajar y subir sucede. Esto también puede ser formalmente bien definido diciendo que la métrica induce un isomorfismo natural entre los vectores y vectores duales.
Así que, cuando usted baja de los índices, debe actuar sólo sobre las componentes de los vectores, no sobre la base, del mismo modo, al elevar los índices debe actuar sólo sobre las componentes de los vectores duales, no su base.
Una buena referencia, recomiendo "Una introducción a los colectores" por Loring W. Tu