11 votos

¿Se puede demostrar que hacer funcionar una GPU a altas temperaturas es malo para la tarjeta?

Si haces funcionar continuamente tu tarjeta gráfica entre 80°C y 90°C, ¿es realmente malo para la tarjeta gráfica? Es decir, ¿se reduce la vida útil de la tarjeta? ¿Se puede demostrar esto? ¿O son sólo suposiciones?

Tengo entendido que el cierre de seguridad de las GPUs es normalmente de 90°C (194°F).

21voto

brian Puntos 1

Estudiemos los mecanismos de fallo y veamos cómo les afecta el calor. Es muy importante recordar que sólo porque un mecanismo de fallo se produzca más rápido con la temperatura, la GPU no necesariamente fallará más rápido. Si un subcomponente que dura 100 años a temperatura ambiente sólo dura 20 años si está caliente, pero otro subcomponente sólo dura 1 año para empezar (pero no le afecta el calor), la vida útil de su producto apenas cambiará con la temperatura.

Ignoraré el tema del ciclismo del que habla Simeón ya que no es mi especialidad.

A nivel de tabla, se me ocurre un componente principal que se "romperá" con la cabeza: Los condensadores electrolíticos. Estos condensadores se secan, y se sabe que se secan más rápido cuando se aplica calor. (los condensadores de tantalio también tienden a tener una vida útil más corta, pero no sé cómo cambia esto con el calor).

¿Pero qué pasa con el silicio?

Aquí, según tengo entendido, hay algunas cosas que pueden causar el fracaso. Una de las principales es la electromigración. En un circuito, los electrones que atraviesan trozos de metal se desplazan físicamente por los átomos. Esto puede llegar a ser tan malo que causará huecos en los conductores, lo que puede conducir a un fallo.

Esta imagen ofrece una buena ilustración (de Tatiana Kozlova, Henny W. Zandbergen; In situ TEM observation of electromigration in Ni nanobridges):

enter image description here

Este proceso aumenta exponencialmente con la temperatura, por lo que, efectivamente, el chip durará menos si la temperatura es mayor y la electromigración es la principal causa de fallo.

Otro mecanismo es la ruptura del óxido, que hace que los transistores sufran una perforación de la puerta dentro del circuito. Esto también depende de la temperatura. Sin embargo, el voltaje tiene un impacto mucho mayor en este caso.

También hay un desplazamiento de VT, ya sea debido a la deriva de los dopantes o a la inyección de portadores calientes. La deriva de los dopantes aumenta con la temperatura (pero es poco probable que sea un problema, especialmente en los circuitos digitales, ya que es un proceso muy lento). No estoy seguro de la dependencia de la temperatura de la inyección de portadora caliente, pero creo que el voltaje es un factor mucho más importante.

Pero hay una cuestión importante: ¿En qué medida disminuye esto la vida útil? Sabiendo esto, ¿deberías asegurarte de que tu tarjeta gráfica se mantiene fría todo el tiempo? Mi opinión es que no, a menos que se haya cometido un error en la fase de diseño. Los circuitos se diseñan teniendo en cuenta las peores situaciones, y se hacen de manera que sobrevivan si se les lleva al límite de la vida útil prevista por el fabricante. En el caso de los circuitos de overclocking: El aumento de voltaje que suelen utilizar para mantener el circuito estable (ya que puede acelerar un poco los circuitos) hará mucho más daño que la propia temperatura. Además, ese aumento del voltaje provocará un aumento de la corriente, lo que acelerará considerablemente los problemas de electromigración.

9voto

case_303 Puntos 1

Sí, ha sido probado que el calor degrada los componentes eléctricos. Los metales se expanden cuando se calientan, la soldadura (utilizada para las conexiones de los circuitos eléctricos) es una aleación metálica, por lo que se expande cuando se calienta. El calentamiento y el enfriamiento constantes harán que las uniones se expandan y contraigan constantemente, lo que puede provocar grietas y, finalmente, el fallo de la unión.

                                                      Graph of Failure rate vs Temperature

El gráfico anterior muestra cómo Ley de Arrhenius da una correlación entre el aumento del calor y el fallo del semiconductor. Este documento detalla los efectos del calor en los componentes electrónicos. Trata más bien de cosas a nivel de los electrones, lo que está un poco fuera de mi ámbito de conocimiento

6voto

joribama Puntos 26

La relación entre el aumento de la temperatura de unión de un semiconductor y la reducción de su MTBF (tiempo medio entre fallos) es bien conocida.

Esta nota técnica de Micron habla de esto

En la práctica, la tasa de fallos aumentará exponencialmente una vez que la temperatura de la unión se acerque y supere los ~125˚C, por lo que si se trabaja muy por debajo de esa temperatura los pequeños incrementos pueden no ser tan críticos.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X