jueves, 2 de febrero de 2017

Uncore clock en Core i7 920 stepping D0. Actualizado - LowLevelHardware

El procesador Core i7 es un complejísimo ingenio con una estructura eminentemente modular. Los ingenieros de Intel lo diseñaron de este modo para dotar de flexibilidad al producto pudiendo así fabricar diversas versiones para distintos nichos de mercado.

En este artículo analizo en profundidad la influencia de la frecuencia del Uncore en las prestaciones de un Core i7 920 fuera de especificación con los núcleos a 3.5 GHz y 3.628 GHz, con multiplicador de cores X20 y Uncore X20 con BCLK de 175 y 181 MHz respectivamente sin Turbo Mode en Memtest86+ 2.11.

En Windows, en cambio con Turbo Mode X21 en cores.

UncoreColoreados los cuatro núcleos de Nehalem. El resto es el uncore.

Una característica clave de todos los procesadores actuales es su naturaleza asíncrona. En el procesador Core i7 hay tres frecuencias de reloj diferenciadas por su multiplicador derivado de un reloj maestro, el BCLK:

  • Frecuencia de los núcleos de ejecución
  • Frecuencia del uncore
  • Frecuencia de los enlaces QPI

La frecuencia de los núcleos es la más conocida e inmediatamente relacionamos su incremento con mayor capacidad de cálculo. En el procesador Core i7 este dominio de reloj comprende los cuatro procesadores con SMT y sus cachés privadas L1 y L2.

En el sistema fuera de especificación que estoy preparando, la frecuencia objetivo es de 3.8 GHz (BCLK 181 y multiplicador X21 Turbo Mode).

PIC02645 Pasando Prime 95 Blend en Windows XP Pro 24h.

Por su parte, la frecuencia del buses QPI no tiene gran importancia en sistemas de un solo socket, pues solo se utiliza para la comunicación con el chipset X58. En sistemas multiprocesador (varios sockets) su función principal es la comunicación entre varios chips Nehalem (Xeon), por ello incorporan tres enlaces de 4.8 a 6.4 GHz.

Frecuencia del uncore en Core i7

En cambio, mucho menos conocida es la influencia de la frecuencia del uncore, o lo que no son los cores (núcleos). El Uncore comprende la caché L3 de 8 MB y sus buses y también las tres controladoras de memoria DDR3 integradas con sus buffers de escritura y los mecanismos de hardware prefetch.

En el modelo i7 920, la frecuencia nominal del uncore son unos meros 2133 MHz para 2666 MHz en los cores sin turbo mode (2.8 GHz en turbo Mode).

Si incrementamos este parámetro obtenemos un claro incremento de prestaciones en software que haga un uso intensivo de la caché L3 y de la RAM e incluso podemos llegar a un diseño síncrono con los núcleos.

Datos experimentales obtenidos en Memtest86+ 2.11 sin Turbo Mode:

Multiplicador CPU X20, Uncore X16 – X20. Las cinco primeras configuraciones con BCLK 175 MHz, la última 181 MHz. En las dos últimas obtenemos sincronía entre los núcleos y el Uncore con multiplicador en ambos casos X20.

Image1 Velocidades en MB/s de los diferentes niveles de caché y memoria para distintos ajustes.

La velocidad de acceso a la L3 compartida (shared) de 8 MB se incrementa en cuanto superamos el multiplicador 2:1 con la memoria (memoria 1400 MHz, uncore 2800 MHz) y a partir de ahí se mantiene en un valor constante, en este sistema 34314 MB/s. (Todas las medidas con BCLK 175 MHz):

imageVelocidad de la caché L3 de 8 MB para distintas frecuencias del Uncore. Cores a 3.5 GHz.

En cambio, la velocidad de acceso a memoria principal por el triple canal DDR3 tiene un comportamiento más curioso con dos inflexiones:

Empieza en 14286 MB/s para un multiplicador Uncore:RAM de 2:1, incrementándose a 15555 MB/s a frecuencias de 2982, 3158 y 3333 MHz del uncore. En cambio cuando sincronizamos el Uncore con los núcleos se incrementa notablemente su velocidad hasta los 17157 MHz.

Esto es debido a que no es necesaria ya resincronización alguna entre los dos dominios de frecuencia, con la latencia añadida que este proceso comporta.

imageVelocidad de la RAM para diferentes frecuencias del Uncore. Cores a 3.5 GHz.

Más de 17 GB/s es un excelente resultado teniendo en cuenta que he utilizado 3 GB en un triple canal de DDR3 1333 normal y corriente Kingston CAS 9 (9-9-9-24 2T). Eso sí, las latencias las he configurado manualmente a 7-7-7-21 con 1T de acceso con una modificación manual de todos los parámetros relevantes en BIOS incluyendo los voltajes.

Capturas de pantalla Memtest86+ 2.11:

PIC02637Cores 3.5 GHz, Uncore 2.8 GHz, memoria triple channel 1400 MHz 7-7-7-21 1T.

Con todo optimizado al máximo incluidos los timings de memoria a 7-7-7-21 1T, el resultado son 14286 MB/s con la memoria en triple channel 1400 MHz. La caché L3 llega a unos 32 GB/s.

PIC02638Cores 3.5 GHz, Uncore 2.98 GHz, memoria triple channel 1400 MHz 7-7-7-21 1T.

Aquí vemos el primer incremento de velocidad en lectura de memoria y caché L3. Respectivamente de 14286 a 15556 MB/s y de 32 a 34 GB/s para la L3.

PIC02779 Cores 3.5 GHz, Uncore 3.50 GHz, memoria triple channel 1400 MHz 7-7-7-21 1T.

Aquí tenéis el segundo punto de inflexión con un gran incremento de ancho de banda (de 15555 a 17157 MB/s), con relojes síncronos cores-uncore a 3.5 GHz.

PIC02644 Core i7 920 @ 3620 MHz cores y 3620 MHz Uncore. Core i7 síncrono (!!).

Estos hechos me hacen sospechar una importante reducción de latencia con estos ajustes; lo comprobaré en unos días ya en Windows.

El diseño asíncrono

Como siempre se ha demostrado estos resultados apoyan la mayor velocidad de los diseños síncronos, aunque por consideraciones de consumo y disipación térmica son más adecuados los diseños asíncronos como Phenom II y core i7.

Señalar por último, que el incremento de la frecuencia del uncore debe de ir acompañado a su vez de un incremento en su voltaje de alimentación, con lo que crece también el consumo y disipación térmica de esta parte del procesador. Por lo que es crítico contar con un adecuado sistema de refrigeración.

Nota: No existe método de conocer la temperatura del uncore o de la caché L3 de 8 MB (no poseen sensores térmicos, al menos visibles al usuario…) con lo que recomiendo prudencia.

Para la segunda parte de este artículo visita este enlace de ProfessionalSAT, con resultados prestacionales excepcionales en Windows.

26 comentarios:

  1. Que opinas respecto a esto:
    http://www.xtremesystems.org/forums/showthread.php?s=76f56e0a19db089e519a108f05300e31&p=3495431#post3495431

    Aun no he podido comprobarlo por falta de tiempo, pero si es cierto que el uncore no es aconsejable tenerlo por encima del QPI resulta complicado conseguir el diseño síncrono a altas frecuencias: el QPI tendria que estar cerca del limite (3'6 - 3'9 ghz) para tener el uncore a *20 o menos con BCLK entre 180-200. Hablo de problemas en frecuencias por tanto entre 3'5 y 4.
    Probando al respecto, no consigo subir el QPI a dichas frecuencias (supuestamente aconsejables segun el post que te indico) estando dentro de voltajes recomendables. No se si es porque el i7 llega al limite antes de los 4 ghz (QPI) o necesita mas voltaje (lo que no he probado por razones obvias).
    En cuanto a mi configuracion es un 17 a 3,66 Ghz (core x20) con BCLK 183, QPI (default x36) y uncore (x17), memorias 1464 mhz ( x8). Las cuentas no salen...

    Por cierto he probado lo que propones en el post y he de decir que no he conseguido ese aumento en la memoria. Da el mismo resultado tanto en L3, L2, L1, y RAM con diseño asíncrono que sincrono. Aunque resulta curioso que mi placa una GA EX-58 extrene tiene una opcion llamada "habilitar bus asincrono". La desactive al ponerlo sincrono y no note diferencia.

    ResponderEliminar
  2. AN, no puedo abrir el enlace que me comentas.

    No veo ninguna necesidad de sincronizar de ningun modo el bus QPI. En el sistema que estoy probando ahora mismo, com BCLK 181, el QPI trabaja a algo más de 6.5 GHz sin ningún problema.

    Sistemas de este tipo llevo unos 20 con hardware muy dispar y nunca he tenido problemas de inestabilidad en el QPI por encima de los 4.8 GHz, ni por encima de los 6.4 GHz. En alguna máquina lo he tenido a 7 GHz a voltaje nominal.

    Este equipo, tal como está configurado roza los 20 GB/s en lectura de memoria en Everest y los 5400 KB/s en el test de WinRAR.

    Lo que sí hay que tener en cuenta que este procesador se ha seleccionado y no es representativo de la media, aunque he de decir que todos los Core i7 D0 se prestan excelentemente para diseños fuera de especificación.

    En un próximo artículo verás las pruebas ya en Windows con tests de rendimiento y capturas de CPUZ, WinRAR, Everest, etc.

    Saludos,

    Carlos.

    ResponderEliminar
  3. Esto pone en el post:

    Ok, I think I finally have some answers to the 20x multiplier instability and a number of other issues many users are complaining about. You will have to follow me here as this is not that simple, but it makes a lot of sense and all of my testing to date has actually confirmed it. I have spent a lot of time figuring this out and I really hope that this will help people. Indeed, I am now able to predict ahead of time what settings will POST, what settings will not, and approximately which component will need to be juiced up higher to result in a more stable system. Furthermore, this will be a very thorough overview of Core i7 overclocking that will expose some serious limitations, particularly on the i7 920 and i7 940 parts. It is all primarily linked to the Uncore and QPI speeds.
    First off, I will use the Core i7 940 for all of my examples. Core i7 920 and i7 940 are for all intents and purposes the exact same chip, but the i7 940 is just factory clocked higher. These are most likely not higher binned chips, and even if they are by some chance it really does not matter. You will soon see why. In essence, same holds true for the i7 965 EE though they are certainly higher binned and quite likely somewhat more forgiving when overclocking. The fact that they can overclock using an unlocked multiplier is a huge bonus for this chip.
    For details on each of the CPU specifications see Intel's website and tech specs/data sheets. I'll just briefly mention the specs here, for reference.

    Core i7 920 - 2.66GHz, 20x133MHz, 4.8GT/s QPI (2.4GHz), QPI multiplier 18x (18x133MHz)
    Core i7 940 - 2.93GHz, 22x133MHz, 4.8GT/s QPI (2.4GHz), QPI multiplier 18x (18x133MHz)
    Core i7 965 EE - 3.2GHz, 24x133MHz, 6.4GT/s QPI (3.2GHz), QPI multiplier 24x (24x133MHz)

    The key thing to remember here is that for Core i7 processors everything is interconnected, much like in case of AMD processors. Therefore, changing the BCLK speed affects everything from core speed, to QPI link speed, to Uncore speed, to memory speed. The key elements and the limiting ones here are the last three, the QPI link speed, Uncore speed, and memory speed. Particularly, the QPI is the limiting factor for the other elements as the highest stable QPI link speed for the current Core i7 processors is 8.0GT/s or 4.0GHz for 99% of systems out there. Some exceptions have been observed, but these are extremely rare. This may also be chipset dependent limitation and it is possible that newer chipsets supporting Core i7 will not have this limitation. Anyway, enough introduction. Let's get to the details.

    ResponderEliminar
  4. First let's look at the relationships between QPI, Uncore, and DRAM speeds.

    DRAM speed must be in a 1:2 ratio or less to Uncore speed which in turn must be in 1:1 or less ratio to QPI link speed (8:9 Uncore to QPI or lower is preferred as the more you approach 1:1 the more unstable the system becomes).

    So why Uncore to QPI ratio of 8:9?

    I derived this ratio from Intel's specifications on Core i7 processors. Highest supported memory for Core i7 is 1066MHz with a QPI of 4.8GT/s or 2.4GHz. According to processor specifications then, Uncore would be running at 2xDRAM (or 2x DRAM multiplier, in this case 16x) which results in an Uncore speed of 2132MHz. When you take the ratio of Uncore to QPI you will get 2132:2400 or approximately 8:9.

    I can run my Uncore higher than QPI and I am not seeing any problems. How come?

    This is possible. In my testing this proved to be less stable than keeping Uncore speed below that of QPI. However, more importantly I found that running Uncore and QPI in a ratio more than 8:9 and approaching 1:1 made the system quite unstable, especially with added stress when overclocking. Furthermore, it is quite likely that running QPI lower than Uncore results in some performance degradation (I did not test this however). Finally, it is important to note that this flexibility is in a large part not there on the non EE parts as you do not have control over core multipliers to the extent where you could be running Uncore very high and QPI link very low as was shown in this example:

    http://www.xtremesystems.org/forums/...79#post3491979

    As a general rule of thumb I did not want to test combinations that fall way outside Intel's specifications, that require voltages approaching critical values according to Intel datasheets, etc. Most users are looking to overclock but still run a long term stable system and not just get the highest benchmark score. Naturally, a lot of instability issues can be resolved by sufficiently increasing voltages to the components experiencing problems but this is very risky and not sustainable for long term use. To be safe I would strongly advise staying within the limits specified by Intel (can be seen here http:// www.xtremesystems.org /forums/showpost.php?p=3435336&postcount=13) and recommend staying at least a good percentage below the absolute maximums.

    Now that we know this relationship, let's dive right into some of the most common issues with Core i7 processors.

    ResponderEliminar
  5. 1. Why is it that I cannot run my 2000MHz memory in my new Core i7 system?

    To understand this note the maximum QPI link speed we mentioned earlier. Using the simple ratio we defined, we can see that with the maximum QPI link speed of 4.0GHz we can have a theoretical maximum Uncore of 4.0GHz and a maximum memory speed of 2.0GHz. These however are only theoretical maximums and are by no means guaranteed. For starters, QPI and Uncore cannot be run at the same speed as any clock oscillations can result in a crash if the ratio of QPI to Uncore ever falls below 1:1. Therefore, Uncore must always be below QPI to avoid this, and preferably below the 8:9 Uncore to QPI ratio to guarantee stability. Consequently, if we cannot achieve 4.0GHz Uncore, this means that we absolutely cannot achieve 2.0GHz memory and we can therefore not guarantee any stability for 2.0GHz memory. Technically, the maximum DRAM speed for a stable system is equal to ((Max. Uncore) / (Safe QPI:Uncore Ratio)) / 2 or (4.0GHz / 9:8) / 2 = 1.777GHz. In between 1.777GHz DRAM and 2.0GHz DRAM you are likely to experience some level of instability over the long term. Past 2.0GHz you are just plain lucky.

    2. Why is it that almost none of the X58 boards can reliably clock the BCLK over 222MHz?

    The answer to this again lies in the QPI link speed. At default (and lowest possible multiplier) for QPI of 18x the QPI link speed becomes 18x222MHz or 3.996GHz (4.0GHz). As we have already stated earlier this is dangerously close to the maximum QPI link speed and is therefore very unreliable. Anything higher than 222MHz and you have exceeded the current QPI maximum so in 99% of cases you will experience no POST. For this matter, a simple guideline is that any BCLK combined with a QPI multiplier that is at or very near maximum 4.0GHz QPI link speed is a candidate for no POST or instability.

    ResponderEliminar
  6. 3. What the heck is the deal with the 20x multiplier then?

    This one is a real kicker (in a funny way). Yes, 20x multiplier is special, in more than one way, but mostly in the way people are trying to use it. You see, there is nothing wrong with the 20x multiplier. Indeed, it works, just like all other multipliers, perfectly fine. It is the DRAM multiplier and BCLK that people are combining with it that causes problems when combined with the QPI multiplier and the Uncore speed. At 20x200MHz, our default memory multiplier is 8 and our memory is at 1600MHz. The Uncore speed becomes 16x200MHz or 3.2GHz (or 2xDRAM at minimum). Therefore, remembering our (safe) ratios of 8:9 Uncore to QPI we see that the QPI link speed must be a minimum of 3.6GHz or higher. In case of 20x200MHz the Uncore and QPI are exactly in this ratio and with the added stress on the core, cache, IMC, DRAM, etc. this becomes a problem. At this point clock oscillations become much more prominent and if the QPI link speed falls below the 9:8 ratio to Uncore at any point in time combined with the added stress on the components the system can and likely will become unstable. Hence, at 20x200MHz with a default memory, Uncore and QPI multipliers we cannot really have a 100% stable system. So you say "just up the QPI link speed then". Not so fast. Remember our multipliers for QPI? They start at 18x, and the next is 22x, and so on. Unfortunately, 22x200MHz results in QPI link speed of 4.4GHz which results in no POST. Therefore, this cannot be done. Indeed, the highest reliable BCLK for default multipliers when using 20x core multiplier is 181MHz which with a 22x QPI multiplier would result in 3.982GHz QPI link. Even if you could set QPI multiplier to 20x, this would still not work for 99% of the boards out there as your QPI link would still be 4.0GHz. So what is the solution you ask? Memory multiplier. It needs to be lower. 1600MHz DRAM is approaching the maximum stress point for 20x200MHz core settings as it pushes on the limits of Uncore and QPI too much. By using a lower memory multiplier (say 6x if possible) the DRAM speed would become 6x200MHz or 1200MHz, Uncore could then be set at 2.4GHz with a lower multiplier which would then allow the QPI link to stay at 18x and well below the QPI link limits but still in a stable ratio to the Uncore.

    ResponderEliminar
  7. Primero pongamonos de acuerdo en medidas, cuando tu dices 6'5 Ghz son en realidad Gt/s y esa medida se divide entre dos para obtener la medida en Ghz. Por eso cuando digo yo 3'3 o 4 Ghz me refiero al doble en Bios (6'6 o 8). Tengo un core i7 C0

    Creo que me explique mal, sincronizo el uncore al core,hasta ahi exactamente tal y como dices tu, sin embargo digo que lo que ocurre es que en mi caso con BCLK 183 resulta imposible poner el QPI mayor que el uncore (siguiendo el post).

    Segundo, no encuentro manera de poner el QPI a unos 7'6 Ghz (bios) con voltajes dentro de lo recomendable. Puede que sea este micro en concreto pero en 6'5 si va , a unos 1'22-23 o por ahi (si el nominal es 1'75 le pongo menos de 0'5 v por encima, lo digo porque no me acuerdo exactamente y no tengo el ordenador a mano). A mas sin embargo no consigo encender.

    Y como digo, poniendo a igual velocidad uncore y cores (sin tener en cuenta lo de QPI mayor y demas) no se produce dicho aumento en lectura. Y si como dices, comprobaste dicha mejora algo debe haber mal...

    ResponderEliminar
  8. Sinceramente, toda la recopilación que me muestras arriba no tiene ninguna base real.

    No está basada, como dice el autor en ningún datasheet de Intel, sobre nehalem, Core i7 o QPI. Yo personalmente he leído todos los datasheets sobre la microarquitectura Nehalem, los tengo impresos y encuadernados. También los del chipset X58 y toda la especificación de los enlaces QPI.

    En segundo lugar, no se parce fuera de especificación un Core i7 C0/C1 a un D0.

    Si revisas artículos míos sobre Nehalem, verás que con los primeros stepping me era difícil superar en núcleos los 3.675 GHz y en el uncore los 3.0 - 3.150 GHz siempre a voltajes bajos para uso contínuos al 100% de uso de CPU 24h al día.

    Para terminar no veo relaciñón alguna entre frecuencia del QPI y la del Uncore. Y en ningún caso te recomiendo aumentar su multiplicador por encima del nominal, el mínimo.

    Yo siempre fijo el multiplicador mínimo del QPI y mantengo su voltaje mínimo mientras aumento el BCLK desde los 133 MHz.

    Saludos,

    Carlos.

    ResponderEliminar
  9. Ok, ya lo supuse ciertamente, pero mejor asegurarse con una segunda opinion.

    Respecto al core i7 problemas no tengo para subir cores, sino al contrario, a 1'16 reales va perfectamente a 3'66 ghz. Y el uncore con voltaje nominal tambien me va a 3 aprox.

    Luego olvidandonos de QPI (que lo tengo con el minimo, sólo queria asegurarme) la unica cuestion es que sincronizando uncores y cores al menos a mi no me produce aumento en lectura de memorias.

    ResponderEliminar
  10. AN, he actualizado el artículo con capturas de Memtest con los varios ajustes para que veas la diferencia real de velocidad.

    Como ves corresponde con los gráficos de Excel.

    Un saludo,

    Carlos.

    ResponderEliminar
  11. Los pantallas solo demuestran que con multiplicador 2:1 Uncore/ram se obtiene menor velocidad que con el multiplicador a mas del doble (17 y 8 por ej.)
    Sin embargo no se cumple que con diseño sincrono a velocidades igual de core y de memoria la velocidad de lectura en memtest varie.
    En la tercera, la memoria va a 1448 mhzy el core a 3620 mhz, lo que explica el aumento en lecturas.
    Si con esas mismas frecuencias pusieras el uncore con menor multiplicador al menos en mi caso no hubo disminucion de lectura por lo que se deduce que tampoco hay aumento al sincronizar el uncore y el core.
    Solamente al poner el uncore a mas del doble de la memoria se produce el aumento de lectura.

    ResponderEliminar
  12. AN, te recomiendo que cojas una calculadora y compruebes lo siguiente:

    - Cores 3.5 GHz, Uncore 2.8 GHz, Memoria 1400 MHz ---- Memtest86+ 2.11: 14286 MB/s

    - Cores 3.5 GHz, Uncore 2.98 GHz, Memoria 1400 MHz ---- Memtest86+ 2.11: 15555 MB/s

    - Cores 3.5 GHz, Uncore 3.16 GHz, Memoria 1400 MHz ---- Memtest86+ 2.11: 15555 MB/s

    - Cores 3.5 GHz, Uncore 3.33 GHz, Memoria 1400 MHz ---- Memtest86+ 2.11: 15555 MB/s

    Ahora se produce el salto de velocidad:
    -----------------------------------
    - Cores 3.5 GHz, Uncore 3.50 GHz, Memoria 1400 MHz ---- Memtest86+ 2.11: 17157 MB/s
    -----------------------------------

    Incrementando BCLK de 175 a 181 se produce un ligero incremento de velocidad:

    - Cores 3.62 GHz, Uncore 3.62 GHz, Memoria 1448 MHz ---- Memtest86+ 2.11: 17745 MB/s

    Yo creo que está claro.

    Saludos,

    Carlos.

    ResponderEliminar
  13. AN, por otro lado y por definición el Uncore, como mínimo, tiene una frecuencia doble al del bus de memoria DDR3.

    Lo que yo destaco es que en el caso del acceso a memoria, no hay solo una inflexión en su velocidad:

    - El primer incremento (leve) al superar el 2X respecto a memoria.

    - El segundo incremento (mucho más importante) al llegar al multiplicador 20X en Uncore, coincidentalemnte en sincronía con los núcleos.

    Es puramente experimental.

    Saludos,

    Carlos.

    ResponderEliminar
  14. - Cores 3.5 GHz, Uncore 3.50 GHz, Memoria 1400 MHz ---- Memtest86+ 2.11: 17157 MB/s

    Comprendo que ese es el resultado que tu afirmas que obtienes pero por las pruebas que yo he hecho no se cumple. Y segundo, justo te falta la captura de ese caso, tienes los anteriores casos (1.Cores 3.5 GHz, Uncore 2.8 GHz, memoria triple channel 1400 ; 2.Cores 3.5 GHz, Uncore 2.98 GHz, memoria triple channel 1400) y el ultimo en que cambias core (3'62) y memorias (1448); pero te vuelvo a repetir que sigo sin ver pruebas reales de que se cumpla que al poner core y uncore sincronos se produzca dicha inflexion en la velocidad de lectura de memoria.

    Hablo del supuesto caso: Cores 3.5 GHz, Uncore 3.50 GHz, Memoria 1400 MHz ---- Memtest86+ 2.11: 17157 MB/s. Falta esa captura, y en mi caso no se verifica que sea cierto.

    Y por favor no me vuelvas a remitir a los resultados que has obtenido ni a explicarme de nuevo el post, comprendo perfectamente todo simplemente quiero verificar si ese aumento realmente se produce (en otro procesador que no sea el mio) y si es asi ya investigare porque en mi caso no es igual.

    Saludos.

    ResponderEliminar
  15. AN, revisa el artículo. He puesto la captura que te faltaba, acabo de hacer la fotografía en mi casa ahora mismo.

    En el futuro, por favor, no dudes de las informaciones que publico, pues te deberías fijar que publico con mi nombre, no con un alias.

    Soy un profesional y una persona seria y solo expongo hechos experimentales rigurosamente comprobados.

    Quizás te gusten mis otros Blogs:

    http://professionalsat.blogspot.com/

    http://satsoftware.blogspot.com/

    Un saludo,

    Carlos.

    ResponderEliminar
  16. Echa un vistazo a este artículo:

    http://professionalsat.blogspot.com/2009/05/sistemas-de-altas-prestaciones-ga-x58.html

    Saludos.

    ResponderEliminar
  17. Realmente gracias, y no te lo tomes a mal ni malinterpretes, es natural que desee verificar los datos que a diario veo en muchas partes y eso no excluye tu blog sino lo hiciese seria un conformista que se cree cuanto vee, luego en vez de reprocharme mi actitud deberias animar a la gente a seguirla, en pocos sitios se ofrece informacion veraz y me alegro que el tuyo sea uno de ellos.

    Ya he visto todos tus blogs y te leo habitualmente, pero si algo no me parece cierta, como viene siendo logico, a pesar de la confianza que inspiras he de tratar de comprobarlo. No pongo en tela tu profesionalidad pero como dices tambien me gusta asegurar los hechos experimentales comprobandolos rigurosamente.

    Ahora solo me experimentar con mi sistema, lo que hare este fin de semana, y ver cual es el problema o el error cometido. Si averiguo alguna otra variante o algun dato interesante te lo haré saber.


    Por cierto, este caso se daria en bios o windows bien sin la opcion turbo mode activada o sin el uso de uno o varios nuclos al 100 %, pero en casos en los que realmente se necesite tal ancho de banda al menos gran parte de las veces se usa al maximo el procesador y por lo tanto no se aprovecharia esta ventaja, al cambiar la frecuencia de uno o varios cores. ¿Has probado esos escenarios? ¿Y con el uncore un multiplo más alto para dar ese margen al turbo en windows?

    ResponderEliminar
  18. En windows siempre utilizo Turbo Mode X21, como puedes ver en ProfessionalSAT y con uso de CPU en todos los cores de 100%.

    Precisamente en estos casos de saturación es cuando se nota prestacionalemnte la latencia y ancho de banda de memoria.

    He probado el caso que comentas, con ambos multiplicadores X21 (cores y uncore).

    También he probado a superarlo con uncore X22 y X23 (cores X21).

    El resultado es que en función de la placa base, la velocidad máxima de memoria se produce con el uncore X19 o X20 y de ahí en adelante no aumenta o lo hace muy levemente.

    Te recominedo que revises artículos pasados de LowLevelHardware sobre microarquitectura de AMD Phenom (o Phenom II) y Core i7. Te aclararán algunas dudas y comprenderás hechos importantes sobre su arquitectura asíncrona. Vete a Marzo 2008 y ve subiendo desde ahí.

    Un saludo,

    Carlos.

    ResponderEliminar
  19. Estimado Carlos:
    En estos momentos me encuentro haciendo una tarea de arquitectura de procesadores para la facultad en la cual tengo que analizar el procesador i7, más arriba vi que decías que tenias los manuales y los datasheets y la especificación de los enlaces QPI, lo que me gustaría saber es si serias tan amable de enviarme esos documentos, desde ya muchas gracias.
    Federico

    ResponderEliminar
  20. Te remito la página de Intel desde la que yo los descargué en su día:

    http://www.intel.com/design/corei7/documentation.htm

    Están en fromato PDF.

    De todos modos para una información en castellano te remito a otro de mis Blogs, lowLevelhardware en el que encontrarás más de diez artículos sobre microarquitectura de los procesadores Intel Nehalem.

    Un saludo.

    ResponderEliminar
  21. Muchas gracias Carlos por tu ayuda.
    Ya leí todos tus post y la verdad que me ayudaron bastante a entender muchas cosas. Te lo agradezco.
    Saludos

    ResponderEliminar
  22. Pablo Gonzalez09 agosto, 2009

    Hola Carlos,

    Antes de nada darte las gracias por compartir tus experiencias con nosotros de manera tan exhaustiva. Quería preguntarte si podrías recomendarme una configuración óptima de un intel i7 920 D0 funcionando con aire.

    Muchas gracias de antemano y un saludo,
    Pablo

    ResponderEliminar
  23. Un ÇBCLK de 181 es una frecuencia fácilmente asumible por cualquier Core i7 920 en una placa base competente.

    Para la memoria con un triple channel DDR3 1333 es suficiente. Con una frecuencia efectiva sobre los 1.45 GHz y latencia 7.

    Obtendrás unas prestaciones excelentes con un coste contenido, eso sí, como recalco en mis artículos, este tipo de sistemas exigen de una validación adecuada.

    Saludos.

    ResponderEliminar
  24. Holaa :) eh leido tu review y aunque lo haya analizado mil veces, hay un punto clave y creo que uno de los mas importantes, el Uncore: Segun lo que entendi, es una ruta de interconexion entre la cache L3, el controlador de memoria ddr3 y las memorias ddr3 no? esta ruta de interconexion posee una frecuencia independiente que se la da el multiplicador que posee; ahora, esta velocidad de transferencia y de frecuencia afecta directamente a la velocidad con que la memoria ram se comunica con el controlador de memoria? la frecuencia del uncore incrementa la velocidad a la hora de comunicarse con el micro o que favorece la sincronizacion de frecuencias entre el micro y el uncore?


    Saludoss!! y te agradeceria mucho si me respondes :p

    ResponderEliminar
  25. En el artículo lo explico en profundidad. El uncore es el antiguo NorthBridge y su frecuencia es crítica.

    En primer lugar es la frecuencia de la L3 unificada de 8 MB y en segundo lugar marca la frecuencia de las controladoras de memoria DDR3.

    Un saludo,

    Carlos Yus.

    ResponderEliminar
  26. aahhh claroo, entonces dependiendo de la fracuencia del Uncore, en intel o del Northbridge en AMD, los tiempos de acceso que tendra el micro hacia la memoria ram aumentaran o disminuiran respectivamente no??
    MUCHAS GRACIAS POR RESPONDER :)

    Un saludo :)

    Pablo...

    ResponderEliminar

Nota: solo los miembros de este blog pueden publicar comentarios.