Estudiemos los mecanismos de fallo y veamos cómo les afecta el calor. Es muy importante recordar que sólo porque un mecanismo de fallo se produzca más rápido con la temperatura, la GPU no necesariamente fallará más rápido. Si un subcomponente que dura 100 años a temperatura ambiente sólo dura 20 años si está caliente, pero otro subcomponente sólo dura 1 año para empezar (pero no le afecta el calor), la vida útil de su producto apenas cambiará con la temperatura.
Ignoraré el tema del ciclismo del que habla Simeón ya que no es mi especialidad.
A nivel de tabla, se me ocurre un componente principal que se "romperá" con la cabeza: Los condensadores electrolíticos. Estos condensadores se secan, y se sabe que se secan más rápido cuando se aplica calor. (los condensadores de tantalio también tienden a tener una vida útil más corta, pero no sé cómo cambia esto con el calor).
¿Pero qué pasa con el silicio?
Aquí, según tengo entendido, hay algunas cosas que pueden causar el fracaso. Una de las principales es la electromigración. En un circuito, los electrones que atraviesan trozos de metal se desplazan físicamente por los átomos. Esto puede llegar a ser tan malo que causará huecos en los conductores, lo que puede conducir a un fallo.
Esta imagen ofrece una buena ilustración (de Tatiana Kozlova, Henny W. Zandbergen; In situ TEM observation of electromigration in Ni nanobridges):
Este proceso aumenta exponencialmente con la temperatura, por lo que, efectivamente, el chip durará menos si la temperatura es mayor y la electromigración es la principal causa de fallo.
Otro mecanismo es la ruptura del óxido, que hace que los transistores sufran una perforación de la puerta dentro del circuito. Esto también depende de la temperatura. Sin embargo, el voltaje tiene un impacto mucho mayor en este caso.
También hay un desplazamiento de VT, ya sea debido a la deriva de los dopantes o a la inyección de portadores calientes. La deriva de los dopantes aumenta con la temperatura (pero es poco probable que sea un problema, especialmente en los circuitos digitales, ya que es un proceso muy lento). No estoy seguro de la dependencia de la temperatura de la inyección de portadora caliente, pero creo que el voltaje es un factor mucho más importante.
Pero hay una cuestión importante: ¿En qué medida disminuye esto la vida útil? Sabiendo esto, ¿deberías asegurarte de que tu tarjeta gráfica se mantiene fría todo el tiempo? Mi opinión es que no, a menos que se haya cometido un error en la fase de diseño. Los circuitos se diseñan teniendo en cuenta las peores situaciones, y se hacen de manera que sobrevivan si se les lleva al límite de la vida útil prevista por el fabricante. En el caso de los circuitos de overclocking: El aumento de voltaje que suelen utilizar para mantener el circuito estable (ya que puede acelerar un poco los circuitos) hará mucho más daño que la propia temperatura. Además, ese aumento del voltaje provocará un aumento de la corriente, lo que acelerará considerablemente los problemas de electromigración.