sábado, 18 de octubre de 2008

Core i7: Preliminares Intel Nehalem - LowLevelHardware

Estamos en fechas próximas al lanzamiento de los primeros procesadores Intel con núcleos Nehalem. Como sabéis implicará cambios de placas base, su socket es obviamente diferente y la migración ya total a DDR3.

Corei7

Aquí querría puntualizar algunos aspectos sobre las prestaciones esperadas con los últimos datos respecto a un actual Core2Quad basado en núcleos Penryn a igualdad de frecuencia.

El HyperThreading en Nehalem

Intel recupera en Nehalem el SMT, es decir, cada uno de los cuatro núcleos ejecuta simultáneamente dos threads. De este modo en Windows veremos ocho CPUs lógicas en el Administrador de Tareas.

Según Intel, aportará un incremento de velocidad de hasta un 30%, aunque será altamente dependiente del tipo de aplicación. Y solamente mostrará sus virtudes en caso de software preparado para 8 threads, lo que no es común todavía.

Latencia L3 compartida de 8 MB

Según las últimas pruebas se aproxima a los 40 ciclos, algo mejor que los 48 ciclos del AMD Barcelona Phenom de 65 nm. De todos modos necesito hacer más pruebas, sobretodo en el terreno de los multiplicadores.

8MB_L3

Latencias de memoria DDR3 dual channel

Rondará los 45 ns, comparados con los 66 ns del sistema desde el que escribo estas líneas.

Veremos si el efecto acelerador de la controladora de memoria integrada en Nehalem respecto al diseño FSB de Core2 es tan espectacular como el cambio del Athlon XP al Athlon 64.

Personalmente pienso que no, ya que Intel ha refinado al límite su arquitectura de FSB quad-pumped. Pero sobretodo porque Core2 incorporaba ya la brillante y extremadamente eficiente tecnología Memory Disambiguation.

Las L2 de solo 256 KB

De pequeño podríamos calificar el tamaño de las L2 de Nehalem. Un factor de reducción en su tamaño de 24x (!!) respectos a un Core2 Penryn de 45 nm. El tamaño del set de trabajo de cualquier aplicación actual desborda los 256 KB.

256KB_L2

Por ello, en parte, la arquitectura Core2, con sus gigantescas L2 de hasta 6 MB (6144 KB) y solo 14 o 15 ciclos de latencia muestra unos resultados tan brillantes.

Con Core i7, Intel cambia radicalmente la arquitectura de caché por un esquema asíncrono y de tres niveles con semejanzas al del AMD Barcelona y Shanghai.

La latencia medida es de 11 ciclos, lo que es lógico pensando que el acceso a L1 se hace en unos mediocres 4 ciclos. Siendo la latencia del segundo nivel de solo 7 ciclos, un resultado brillante.

Prestaciones esperadas

Comparado con un C2Q a la misma frecuencia, Nehalem va a ser sobre un 20 - 30 % más rápido de media en aplicaciones comerciales de sobremesa.

En juegos será equivalente y en alguno de ellos algo más lento que un C2Q actual equivalente debido a la mayor tasa de fallos de su L2 y la mayor latencia de su L3.

En software profesional que sea capaz de utilizar los 8 threads puede llegar a ser un 40% más rápido (en pico).

En software de entorno servidor será claramente más veloz y escalará brillantemente en entornos multisocket, ahí espero mejoras de más del 100% en 8 sockets y según la aplicación debido al espectacular ancho de banda del triple canal de DDR3 1333.

Corei7chip

Pensemos que los núcleos de procesamiento de Core i7 se mantienen invariados en los esencial respecto al Core2, excepto algunas mejoras más o menos importantes y el SMT.

Resumiendo y en el espacio de consumo, Core i7 Nehalem será un importante avance evolutivo sobre Core2, aumentará las prestaciones y se deshará por fin del veterano, arcaico y desfasado FSB que nos acompaña desde los albores del x86.

Etiquetas de Technorati: ,,,,,,