jueves, 2 de febrero de 2017

Intel Sandy Bridge versus Westmere die. Actualizado – LowLevelHardware

Las primeras imágenes del die del nuevo procesador de Intel que llegará al mercado a principios de 2011 revelan algunas peculiaridades interesantes.

SB_4C_630p Sandy Bridge quad core.

Será, según el fabricante, una microarquitectura que aportará algunos cambios fundamentales sobre la base de la exitosa generación Nehalem. En un artículo anterior de ProfessionalSAT describí algunos de sus detalles.

Diferencias evolutivas apreciables en el die respecto a Westmere:

Para fotografías de mayor calidad y resolución visita este artículo de ProfesionalSAT:

CoreIntel Sandy Bridge 32 nm die. Núcleo de ejecución.

Westmere_core_dieEl núcleo de ejecución de Intel Westmere 32 nm.

Observando el core (núcleo de ejecución) ya se ven algunas divergencias de diseño aparentes:

  • La caché L2 (esquina superior derecha) mantiene su tamaño de 256 KB pero su organización física adopta un esquema cuadrado, con menor distancia máxima y posiblemente un mejor tiempo de acceso. Se rumorean 9 ciclos.
  • La caché L1d (caché L1 de datos) (recuadro superior central) por contra mantiene un esquema muy similar.
  • No así la L1i (caché L1 de instrucciones) (en el recuadro inferior izquierdo) que aumenta considerablemente su superficie posiblemente para reducir su consumo o quizás para ampliar su asociatividad.
  • Notable es la presencia de una gran SRAM sobre ella (la L1i) de gran tamaño (comparable a la L1i) y pegada a su parte superior. Pudiese ser una reedición de la famosa Trace Cache ya conocida en la antigua microarquitectura Intel Netburst. Microarquitectura en imágenes (I).Trace cache.

Configuración de la caché L3 compartida:

La distribución y orientación de la caché L3 en Westmere (Nehalem 32 nm) y Sandy Bridge (32 nm) difiere notablemente.

SandyBridge_dieEl core de Sandy Bridge junto con su banco de 2 MB de L3.

Westmere_core_die_L3  Westmere con su banco de 2 MB de L3.

Los arrays de L3 en Bloomfield (Core i7 y Xeon de 45 nm) y Westmere (Gulftown 32 nm hexacore) son paralelos al core y la lógica de control y tags de L3 están a un lado de la SRAM, en cambio, en Sandy Bridge, la L3 tiene más bien un esquema de memoria “particionada”.

Me explico, en Sandy Bridge la apariencia de la L3 es de un banco discreto perteneciente a una organización superior, probablemente su organización sea en algunos aspectos similar a la de Nehalem EX de 45 nm (Xeon octal core).

Los L3 tags y buffers de escritura permanecen en el centro de dos arrays de L3 de 1 MB cada uno.

Todos estos cambios se deben a que ahora la L3 no solo debe de dar servicio a los cores sino también a la GPU integrada en el die de Sandy Bridge (tiene acceso directo a L3). Por ello necesita de mayor ancho de banda y una organización distinta: un ring bus de 256 bytes.

Lo que sí permanece invariado es el tamaño relativo en MB por core: 2 MB.

Los sockets de Sandy Bridge

Las versiones de sobremesa irán montadas sobre un LGA1155 incompatible con el actual LGA1156 de los actuales i3, i5 e i7 de dual DDR3 de 2 y cuatro cores.

SB_1155Socket LGA1155.

SB_2-4C_1155_630En LGA1155 veremos versiones de 2 y 4 cores con GPU integrada.

Sistemas de Altas Prestaciones Sandy Bridge

Las versiones que a mí más me interesan, pues sustituirán al actual LGA 1366 de los Core i7 de triple channel DDR3, contarán con 1356 pines y se esperan octal core nativos con 16 threads (los sustitutos de los actuales Gulftown de 32 nm). Sin duda será una muy interesante actualización.

SB_8C_1356_630 En el socket de gama alta LGA1356 vendrá el codiciado 8 cores.

Contará igualmente con 3 canales DDR3 hasta 1600 MHz para 38.4 GB/s de ancho de banda agregado de memoria. Será el sweet spot para estaciones de trabajo.

Los que me conocéis personalmente o por mis Blogs, sabéis que la mayoría de mis clientes necesitan el máximo absoluto en prestaciones por sus muy exigentes cargas de trabajo.

Realizan procesos de cálculo que duran semanas en sistemas Quad Core i7 a 3.8 – 4 GHz optimizados en todos sus parámetros al extremo con una total garantía de estabilidad. Es por ello que esperan ansiosamente cada iteración de nuevos procesadores y rápidamente, cuando esta llega al mercado, sustituyen sus antiguos sistemas (siempre menos de 2 años) por los nuevos procesadores.

Con Sandy Bridge y debido a su muy contenido TDP espero excelentes márgenes de aumento de frecuencia para mis Sistemas de Altas Prestaciones allá por el 2011 basados en esta nueva microarquitectura.

Muy probablemente será seguro superar con cierto margen los 4 GHz para cargas de trabajo 100% en todos los cores ininterrumpidas en el modelo octal core. Con los procesadores actuales me es difícil llegar a los 4 GHz con temperaturas satisfactorias en estos casos, incluso tras un arduo proceso de hand picking.

Para servidores de gama alta:

[PIC03252[3].jpg]Para superar los 4 GHz con estabilidad absoluta hay que hacer diabluras.

Para sustituir a Nehalem EX 8 cores y Westmere EX 12 cores Intel nos presentará Sandy Bridge EX en socket LGA2011:

SB_8C_2011_630

Hasta la próxima.

Si consideras útil el contenido de este Blog, ayuda a mantenerlo ojeando algunas de las ofertas que consideres interesantes de nuestros anunciantes.