¿Intel o AMD publican especificaciones sobre la velocidad a la que pueden producirse fallos de cálculo en sus CPU? Sospecharía que depende mucho de la edad y la temperatura, pero seguramente debe haber algún tipo de cifras disponibles.
No me interesan los errores de fabricación evidentes (en los que todo un lote está defectuoso o algo así). Me interesan los errores espontáneos debidos a fenómenos físicos no relacionados con un error de diseño. También interesa si el error se origina en la CPU o en algún otro chip del sistema (por ejemplo, un fallo momentáneo de tensión en el procesador también provocaría errores).
Tengo curiosidad, pero mi búsqueda en la red no me da lo que quiero. Sólo quiero obtener ideas aproximadas de que dejé mi programa en ejecución durante X horas cuántos errores espontáneos podría esperar tener.
0 votos
Ver también electronics.stackexchange.com/questions/12757/
1 votos
Creo que es mucho más probable que los módulos de memoria del sistema se vuelvan un poco locos por los impactos de partículas. Incluso si pudieras encontrar la tasa de error de la CPU hay ciertamente más que considerar. La mayoría del hardware de servidor comercial utiliza memoria ECC, pero no he oído hablar de mucho fuera del sector aeroespacial que haga redundancia de cálculo. Redundancia de CPU en caso de fallo, claro... pero no una redundancia que compruebe los cálculos.
1 votos
Sí, de todo el material que he encontrado ahora parece que la memoria es el mayor problema. Aunque las consideraciones de diseño de AMD indican que también lo consideran un problema en sus CPU.