jueves, 2 de febrero de 2017

Electromigración en microprocesadores – LowLevelHardware

Todos los componentes, tanto los mecánicos como los electrónicos, están sometidos a un desgaste por el uso y en este grupo incluyo a los microprocesadores, cachés y chips de memoria DRAM y Flash.

Bild5Microfotografía: creación de un cruce entre dos conductores por electromigración.

En un nuevo artículo en ProfessionalSAT profundizo en la relación temperatura – degradación física de semiconductores:

Temperatura y degradación física en semiconductores –ProfessionalSAT

Recientemente he sufrido personalmente los efectos de la electromigración en varios de mis sistemas junto con otros de mis clientes, todos ellos de una antigüedad similar. En este caso, la degradación y posterior avería se ha producido en la memoria DDR3 de algunos de mis Sistemas de Altas Prestaciones basados en CPUs Core i7 de la serie 900.

Por ejemplo, un disco duro se degrada día a día durante su utilización normal y conforme pasan los meses podemos seguir la variación de sus parámetros de funcionamiento mediante la tecnología SMART que nos informa crípticamente del estado de salud del dispositivo. (Prometo un artículo sobre SMART cuando tenga tiempo…)

Electromigración

En dispositivos altamente miniaturizados como una CPU / GPU o un chip DRAM DDR3 o GDDR5 (memoria actual de las GPUs) se da una degradación constante de sus características eléctricas. La electromigración es el proceso causante de la mayoría de fallos en este tipo de dispositivos.

1153426521

La electromigración consiste en el arrastre y transporte de los átomos metálicos del conductor por el constante flujo de alta intensidad de electrones que lo atraviesa.

Se da una transferencia de momento (cantidad de movimiento) del electrón al núcleo metálico (literalmente lo golpean mayoritariamente en una dirección y sentido) y el núcleo va avanzando paso a paso en el sentido de la corriente creando dos tipos de anomalías:

Huecos: hay zonas que literalmente se vacían de metal, incrementando la resistencia del conductor y eventualmente provocando un fallo total del dispositivo por corte de corriente.

Void_formationFormación de huecos por electromigración.

576804216Este hueco ha causado un fallo total en el dispositivo al interrumpir la corriente.

Acumulaciones: en otras zonas, el material metálico se agrega y crea áreas de mayor contenido metálico, se incrementa la sección del conductor y puede llegar a crear puentes de conducción con líneas adyacentes llevando también al fallo del dispositivo.

atwu-2Puente metálico entre dos conductores creando un corto circuito.

En casos extremos la creación de acumulaciones puede llegar a fracturar el aislante y crear corto circuitos con zonas vecinas.

Factores que influyen en el proceso de electromigración

Favorecen la electromigración:

Las altas temperaturas. Se produce un incremento en la resistencia eléctrica del conductor metálico y aumentan las vibraciones atómicas de los núcleos metálicos.

Consultar: Temperatura y degradación física en semiconductores –ProfessionalSAT

Las corrientes elevadas (altas intensidades). A mayor flujo electrónico, mayor transferencia de momento de los electrones a los átomos metálicos de cobre o aluminio.

La poca sección de los conductores. A menor sección mayor densidad de corriente y más electromigración. En microprocesadores contemporáneos, de 32 nm (o 28 y 22nm), está claro que este factor es importante.

Minimizar los efectos de la electromigración

Está claro que debemos hacer lo posible para eludir los catastróficos efectos de la electromigración:

PIC03263

Debemos reducir la temperatura de funcionamiento de nuestros procesadores y memorias DRAM al mínimo posible:

Mediante el uso de los mejores sistemas de refrigeración disponibles.

El uso de una pasta térmica adecuada a la superficie del radiador de CPU (según la rugosidad de la base).

DSCF2366Un detallado estudio del flujo de aire es necesario en ciertos sistemas.

Y el exhaustivo estudio de la circulación del aire en la torre y la optimización de las presiones y flujos de aire.

PIC03259Uno de mis Sistemas de Altas Prestaciones con 6 DIMM DDR3 refrigerados por dos Noctua.

En el caso de los módulos DIMM de memoria DRAM DDR3 o la memoria GDDR5 presente en las GPUs actuales, lo único que podemos hacer es garantizar sobre ellas el mayor flujo de aire posible y a una temperatura adecuada. (Fotografía superior).

EMDaños en un conductor por electromigración.

Es importante mantener el voltaje de alimentación del dispositivo en el mínimo posible que garantice la estabilidad del sistema y la exactitud total en nuestros cálculos o procesos.

A ser posible es recomendable escoger manualmente los procesadores y los módulos de memoria (hand picking) seleccionando los que posean las mejores características eléctricas (menor voltaje de funcionamiento a la frecuencia deseada u objetivo).

EM1Proceso de electromigración, creación de un hueco.

En mis Sistemas de Altas Prestaciones sigo todas estas directrices a rajatabla y aún así no me he librado de los efectos de la electromigración como podéis observar en mi artículo de ProfessionalSAT.

Echad un vistazo a la web de mi nueva empresa, un proyecto de gran envergadura que llevo preparando hace más de un año.

Os lo recomiendo para diseño de sistemas de altas prestaciones con exquisito cuidado en las temperaturas de los componentes y siempre con los menores voltajes posibles para garantizar la mejor durabilidad y rendimiento:

ip16_texto_300px_blanco[4][2][2][2]

Allí tenéis a vuestra disposición el formulario de contacto, para consultas sobre este artículo hacedlo más abajo en la sección de comentarios.

Y mi nuevo Blog de contenido muy técnico y actualizado donde encontraréis artículos míos sobre hardware, procesadores y sistemas y también otros posts de expertos programadores e informáticos sobre otros temas de actualidad:

infromaticapremium-blog[4][2][2][2]

Si consideras útil el contenido de este Blog, ayuda a mantenerlo ojeando algunas de las ofertas que consideres interesantes de nuestros anunciantes. Gracias de antemano.

El que tenga dudas o aportaciones tiene para ello la sección de comentarios, intentaré responder a todos y con la máxima claridad. Los Blogs deben de ser lugares de intercambio y agradezco vuestro feedback.

33 comentarios:

  1. Exelente como siempre Carlos, es un tema que preocupa, yo por suerte cambio la pc todos los años y ni cerca de las horas de trabajo a la que vos expones a tus super pc, pero seria un tema a tener encuenta si haria oc y quisiera que me dure la pc, te cuento tengo un i2500k a 4.6 dos 560ti y 9 ventiladores de 12cm jua uno cuando arma una pc asi la va a presionar pero como decis e visto en los forum varios 2500k con el imc quemado, por ahi es mucha tentacion y se pasan yo personalmente no lo paso de lo que dice intel y nunca puse un cpu mio a mas de 1.4v espero que me dure gracias Carlos

    ResponderEliminar
  2. ¡Muchas gracias por el artículo! desde hace tiempo que estoy buscando información al respecto en español. Me gustaría, de ser posible en algún momento, un articulo de usted dedicado a los procesos de fabricación Bulk, SOI, HKMG y los que vengan =)

    ResponderEliminar
  3. Anónimo,

    En mis Core i7 2600K (no tengo ningún 2500K) me planto en los 4.4 GHz a voltajes en carga sobre los 1.25V, en BIOS 1.30V - 1.34V.

    No me gusta subir más pues he comprobado que los Sandy Bridge se degradan rápidamente con el voltaje. De hecho, nada más salir al mercado, durante los tests preliminares a principios de 2011 (cuando todavía no se había descubierto el Bug SATA2), uno "murió" en mis manos a 4.5 GHz y 1.40V con memoria a 1.65V a 1866 MHz.

    Los Core i7 anteriores de la serie Nehalem 9XX 45 nm soportan mejor los voltajes elevados.

    Dadivcianorris,

    Sobre los procesos de fabricación, Bulk (normal), SOI (Silicon On Insulator) y HKMG (High K Metal Gate) quizás algún día le dedique tiempo. En cualquier caso SOI está acabado en su forma actual, no compensa su alto coste.

    AMD va directo al proceso Bulk en los 28 nm (half node) e Intel, en cambio, se decanta por el TriGate HKMG 22nm con transistores 3D.

    AMD conseguirá bajas disipaciones térmicas, aunque no tengo claro si llegará a altas frecuencias.

    Para Intel todo pintaba de color rosa pero están teniendo más problemas de los esperados y retrasan, unos más otros menos, todas sus CPUs 22 nm y además no aumentan nada la frecuencias respecto a sus actuales diseños de 32 nm.

    A los dos os agradezco las felicitaciones,

    Saludos,

    Carlos Yus Valero.

    ResponderEliminar
  4. Bueno Carlos no es la mejor noticia la del 2600k quemado pero es asi te agradesco ahi lo puse a 4.4 al 2500k vcore estandar pica 1.312 en cpuz 72 grados nucleo mas caliente vrm 48 grados 20limpaks 115gflops ok en idle descansa a unos 0.968v 35grados nucleo mas caliente posee un cooler master v6gt.

    Gracias Carlos!!

    ResponderEliminar
  5. Una pregunta, así como quien no quiere la cosa :P . Para los sistemas de alto rendimiento que montas, no seria mejor usar Opteron's o Xeon's? Que están mejor preparados para uso intensivo. O por el precio no compensa?

    ResponderEliminar
  6. Anónimo,

    El i7 2600K que comenté más arriba no se quemó, lo que le ocurrió es que dejó de ser estable en cálculos a 4.5 GHz. Daba errores a las 2 h en Prime95 X64. A frecuencia nominal era absolutamente estable.

    Lo que sucedió es que el procesador se degradó debido al voltaje de 1.40V y dejó de ser estable a una frecuencia a la que anteriormente lo era. Electromigración en acción.

    Más que nada esto sirve para acotar intervalos de voltaje y frecuencia seguros. Con los 2600K prefiero no arriesgar pues no son amigos de los altos voltajes con mis cargas de trabajo al 100% de CPU. Cargas vectorizadas FPU y con duraciones de meses sin interrupción y siempre a temperaturas sobre los 70ºC.

    Con esto no quiero decir que en un uso ligero de sobremesa no sea posible configurar 2600K con los mencionados parámetros pues la carga no es contínua ni tan elevada.

    Saludos,

    Carlos Yus Valero.

    ResponderEliminar
  7. Acheron,

    No utilizo Opteron o Xeon por múltiples razones:

    - Son mucho más lentos por core y por thread.

    - No se pueden configurar fuera de especificación.

    - Son mucho más caros.

    Necesitaría facilmente una máquina dual (dos sockets con 2 CPUs) con Chips Xeon de gama media (Quad cores con HT) para igualar la velocidad de cálculo de una máquina actual.

    Fácilmente costaría unas 5 veces...

    Un saludo,

    Carlos Yus Valero.

    ResponderEliminar
  8. Oye ya has sufrido migración electrónica en algún cpu? o solo te han fallado memorias? como puedo identificar si un cpu ya está en sus últimas debido a este efecto? gracias!!

    ResponderEliminar
  9. Buen artículo, me ha gustado y se aprende bastante. ¿En la foto con los ventiladores es un sistema tuyo? ¿Están todos los ventiladores metiendo aire a la caja? ¿No es eso algo malo para la refrigeración?

    ResponderEliminar
  10. Me referia a ventiladores Scythe que se me había olvidado.....xD

    ResponderEliminar
  11. Davidcianorris,

    La electromigración se da con mayor frecuencia en CPUs que en cualquier otro componente. He visto muchas CPUs de diferentes generaciones degradadas por electromigración.

    Lo primero que se aprecia es pérdida de estabilidad a una frecuencia dada a la que anteriormente era estable, otras veces aumenta la temperatura de un core o varios respecto a la usual con la misma carga de trabajo.

    Saludos,

    Carlos Yus Valero.

    ResponderEliminar
  12. Tartanboi,

    Deberías de leer el artículo sobre esa máquina en concreto para saber qué ventiladores extraen aire y cuales lo inyectan en aquel diseño.

    En sistemas de ese tipo interesa tener presión positiva dentro de la torre para forzar la salida del calor de las 4 GPUs (que generan solas unos 850W).

    Un saludo,

    Carlos Yus Valero.

    ResponderEliminar
  13. Gracias por la recomendación, he leido el artículo del equipo y está muy bien. ¿Tienes alguno especializado en refrigeración/ventilación?

    ResponderEliminar
  14. Tartanboi,

    He escrito bastantes artículos sobre refrigeración, aplicación de interfaz térmica, hotspots en procesadores, ... tanto teóricos como más prácticos y otros con sistemas de ejemplo.

    La mejor manera de encontrarlos en buscar en el buscador de cada Blog, es la manera más rápida. Busca por ejemplo refrigeración, pasta térmica, ...

    Un saludo,

    Carlos Yus Valero.

    ResponderEliminar
  15. Hola Carlos te molesto por la siguiente cuestion, viendo los ultimos reviews de los nuevos ivy bridges, mas se necesita saber del tema que vos espusiste en este articulo mi sandy bridge el 2500k tiene segun intel un limite de 1.4v pero como vos decis es ilogico ese voltage con los ivy es peor intel no habla al respecto algunos dicen no pasarlos de 1.2v otros lo usan a 1.4 es cualquiera, encima ya dicen que como son tan chicos el calor no se dicipa eficientemente... osea los dicipadores frios el procesador a 90° (exagerado) me suena a que intel no esta diciendo algo, no se Carlos vos que opinas, se podran refrigerar los proximos cpus? O tendran que cambiar la dispocicion fisica interna para evitar esos hots spot como dirian ellos. suerte Carlos

    ResponderEliminar
  16. Anónimo,

    Los Sandy Bridge de 32 nm no toleran bien el voltaje. No es un fallo sino un diseño deliberado, Intel intenta reducir al mínimo el consumo (y lo está consiguiendo) y para ello optimiza sus transistores y sus diseños fabricados con ellos a voltajes reducidos.

    En SB no es bueno superar los 1.35V o entraremos en zona peligrosa.

    Con Ivy Bridge 22 nm todo este tema se acentúa y no es bueno superar los 1.20V pues están muy orientados a bajo voltaje ( incluso menor a 1V a frecuencia nominal en el 3770K a 3.9 GHz con absoluta estabilidad.

    No se puede tener todo, pero, en mi opinión la elección de Intel es absolutamente acertada.

    Saludos,

    Carlos Yus Valero.

    ResponderEliminar
  17. Saludos carlos, me gustaría hacerte una consulta. Tengo un Asus P5n-e sli y me compre un Core 2 Duo E8400 C0 y pues quisiera llegar mi procesador a 4Ghz y tengo un par preguntas:

    ¿Seria prudende ponerle 1.7v al NB? lo digo porque con 1.5v no supera los 1625Mhz de FSB al pasar eso empiezo a perder estabilidad. Con 1.7 paso de los 1700(3.89Ghz de CPU) No se si seria prudente ponerle 1.7v lo tengo refrigerado con un viejo fan puesto sobre el disipador de serie, pero no se que tan efectivo sea ya que según se, el NB no tiene sensor de temperatura(el sensor del board esta bajo la RAM) o simplemente este board no da mas sin quemarse.

    Y sobre la segunda, pues compre este procesador por Ebay, usado. en este momento lo tengo a 3.65Ghz y tuve que usar 1.408v en idle, 1.344 bajo stress mi pregunta es -negritas- ¿es ese voltaje muy alto? La verdad me gustaría mucho llegar este proce hasta los 4GHz pero tampoco lo quiero dañar(si me dura 1 año y medio mas con mas voltaje tampoco me importaría).

    y por cierto ¿cual seria el voltaje máximo recomendado para el proce? y cual seria la temperatura máxima del proce? esta me llega a 53º después de 1 hora bajo orthos y sino mal recuerdo rozando los 80º en los núcleos(leído con everest)

    Gracias de ante mano por la respuesta. Saludos.

    ResponderEliminar
  18. te respondo yo para que no se enoje Carlos primero ese FSB a 1600 mhz no lleva voltaje extra osea esta hecho para funcionar asi ya que hay cpus de alta gama que usan 1600mhz como estandart segundo el 8400 llega yo tube uno con el fsb a 1600 a 4.0ghz tercero Carlos no te va a autorizar a usar voltajes superiores a los recomendados que desde ya alcanzan para ese oc tendria que estar en 1.35 1.37 para 4ghz si no llegas mejora el cooler cuarto escribi mejor jua quinto usa 20 pasadas de linx y 4 horas de prime para saber si es estable sexto todo lo que te dije bueno maso esta en este blog solo tiene que buscarlo suerte
    sory por meterme Carlos pero siempre estas ocupado y quiero mas articulos tuyos jua suerte Carlos!

    ResponderEliminar
  19. Pues te respondo que esta placa salio con soporte "oficial" a 1066Mhz de FSB mas tarde mediante actualización de BIOS lo elevaron hasta los 1333(en realidad creo que era hasta 800MHz aunque no lo recuerdo bien). Y por cierto para poner un e8400 a 4ghz necesitas 1780(445*9), con 1600 de fsb solo llegas hasta los 3.6.

    Y como critica constructiva en un futuro intenta escribir mas claro, ayudara a que llegue mejor el mensaje. :)

    Por cierto esa caída de voltaje es normal? de 1.408 en Idle hasta los 3.44

    ResponderEliminar
  20. Buenisimo viendo que te interesa me explico mas, el 8400 yo todavia lo tengo y como decis tiene el mutiplicador en 9 y te complica todo bueno lo que yo hice fue primero lapear el procesador (lijarlo)te permite pasar de 3.6 a 3.8 gratis luego lo demas no te puedo decir ya que yo usaba p35 y vos usas nvidia de fsb lo que vi es de ver la foto de la madre tuya es que el controlador de voltaje del procesador es viejo con capasitores electroliticos choque expuestas etc y eso puede causar ineficiencia que vos lo ves como caida de voltaje fijate que hoy en dia las faces que alimentan el procesador son muy importantes ya que filtran la corriente y la dosifican al procesador para que te des una idea salio la noticia de que gigabyte saca una madre con 32 fases la tuya tienes 6 viejas sin cooler ni nada que las enfrie ademas el problema que yo veia antes era que cuando pasaba linx o prime por 1 o 2 horas el voltaje tenia pequeñas caidas por decirte 3.65v y caia 3.60 por un segundo y chau error tiraba entonces mas voltaje desde bios mas calor mas voltaje nesecitas y asi se sigue jua entonces tu pared me parece que son los 3.8ghz pasar de ahi requiere hilar fino osea lapear, buen cooler (hyper 212 con dos 120mm) andaria y es barato refrigerar los vrm y dar 10 a 15% de mas voltaje al fsb y 10 % al southbridge a esto tenes que subir el fsb y bajar el multiplicador del cpu para probar que la memoria y el fsb se la bancan despues el cpu si todo anda bien sumas linpack mas un furmark para la placa de video y ahi probas la fuente si se la banca ya que estaras comiendo mas watts de lo normal bueno cualquier cosa que no entiendas ya se va a sumar Carlos me retara y pondra los puntos sobres las i jua bueno suerte y trata de entrar al club de los 4ghz! Suerte

    ResponderEliminar
  21. Ex,

    Mala idea subir el voltaje en esos chipsets. Muchas veces se averían por temperatura a frecuencia y voltaje nominal, imagina a voltaje de 1.70V. No te obsesiones con la máxima frecuencia busca un compromiso consumo - calor - ruido - prestaciones.

    80ºC en Core2Duo es bastante alto en tests de ese tipo, yo no iría más allá.

    Saludos,

    Carlos Yus.

    ResponderEliminar
  22. Anónimo,

    Como dices en placas con este chipset aumentar voltajes (chipsets nVidia para Intel) es mala idea...

    Saludos,

    Carlos Yus Valero.

    ResponderEliminar
  23. Anónimo y Ex,

    En general la caída de voltaje de un chip en carga máxima respecto a su voltaje a esa misma frecuencia en reposo es normal y puede llegar a esos 50 mV sobre los 1.350V que comentas.

    Sobre las 32 fases de la placa Gigabyte, es marketing puro. No es necesario...

    Y para Anónimo,

    Cuesta leer lo que escribes, sin puntos, comas, párrafos... Un poco de corrección sería de agradecer.

    Saludos,

    Carlos Yus Valero.

    ResponderEliminar
  24. Hola Carlos, excelente blog que te has montado. Tengo una consulta para ti, quizá esta sección del blog no sea para esta clase de temas, si es así te pido disculpas. Sabiendo de antemano tu experiencia en el armando equipos, mi problema es el siguiente. Mi hermano tiene un procesador AMD Phenom II x4 940 el cual compro en 2009 y nunca monto en un motherboard. Es necesario remover la pasta térmica que tiene en disipador del cooler para montarlo?? digo esto por el tiempo que tiene la pasta en el disipador, este tipo de productos se vence o algo por el estilo o puede montar su microprocesador tranquilo confiando plenamente en que la pasta termina va a cumplir su función a pesar del tiempo que tiene? En caso de que me respondas que es necesario remover la pasta, como se hace eso y con que productos, me recomiendas algún enlace de tus blogs en donde salga esta información. Desde ya muchísimas gracias

    ResponderEliminar
  25. SecretWeapon,

    En principio no debes quitar la pasta del radiador de CPU. Es de las mejores que podrás encontrar y suele estar intacta tras largos periodos.

    Solo debes comprobar que no ha rozado con nada y que no se ha retirado de la base accidentalmente.

    Saludos,

    Carlos Yus Valero.

    ResponderEliminar
  26. Carlos Yus Valero, escriba algo nuevo, :))))):)))))
    Seguimos esperando gracias!!!!!!!!

    ResponderEliminar
  27. Carlos Yus Valero, me imagino que la situacion en españa esta mal y usted esta trabajando a brazo partido, desde la Argentina mis saludos y deseos de que mejore la situacion asi nos puede ilustrar con mas de sus articulos suerte Carlos y pronta recuperacion.

    ResponderEliminar
  28. Hola Carlos, sigo tus blogs con interés hace mucho tiempo. Ya se que dispones de poco tiempo, pero espero que sigas publicando. Un saludo

    ResponderEliminar
  29. Anónimo, Anónimo y frienger,

    He publicado un artículo nuevo en ProfessionalSAT sobre los AMD Vishera:

    http://professionalsat.blogspot.com.es/2012/11/amd-vishera-fx-8350-primeras.html

    Intentaré sacar algo de tiempo para seguir publicando con mayor asiduidad,

    Saludos,

    Carlos Yus Valero.

    ResponderEliminar
  30. Acabo de descubrir tu blog Carlos, me apasiona todo este mundillo y como tú me dedico a aconsejar a clientes y/o amigos, de algo sirve llevar rompiendo cosas desde que tengo uso de razón! jeje.

    Mi más sincera enhorabuena por el blog. A favoritos va.

    ResponderEliminar
  31. Muy buen artículo Carlos, continúa así y la gente seguro que pincha en los anuncios... ;-)
    Un saludo

    ResponderEliminar
  32. Muy buen artículo Carlos, continúa así y la gente seguro que pincha en los anuncios... ;-)
    Un saludo

    ResponderEliminar
  33. Muchas gracias por las felicitaciones a todos, la verdad es que por temas de trabajo voy muy liado pues estoy muy ocupado entre mi trabajo de mañana y mis múltiples ocupaciones como freelance... aunque intentaré encontrar algún hueco temporal para dedicarlos a estos Blogs.

    Saludos,

    Carlos Yus Valero.

    ResponderEliminar