miércoles, 25 de junio de 2008

ATI Radeon series HD4800. Actualizado.

La nueva gama de procesadores gráficos de AMD - ATI, el flamante RV770, ha llegado al mercado revolucionando el mundo de las tarjetas gráficas de consumo.

45843A_RV770_single_Chip_Frt[1]

El procesador ATI RV770. Pulsa para ampliar.

La gama queda como sigue:

  • ATI HD4850. 625 MHz. RAM 256 bit @ 2.0 GHz GDDR3. 800 procesadores, 40 unidades de texturas, 16 ROPs. 199$.

45835A_ATrHD4850-SS_blk[1]

ATI HD4850 single slot. Pulsa para ampliar.

  • ATI HD4870. 750 MHz. RAM 256 bit @ 3.6 GHz GDDR5. 800 procesadores, 40 unidades de texturas, 16 ROPs. 299$.

45839A_ATrHD4870-DS_blk[1]

ATI HD4870 dual slot. Pulsa para ampliar.

  • Le seguirá la ATI HD4870 X2 con dos procesadores RV770 y 2 x 512 MB GDDR5.

La memoria GDDR5 envía cuatro datos por ciclo de reloj. En la HD4870 la frecuencia de memoria de 900 MHz da como resultado una frecuencia equivalente de 3.6 GHz.

Con 160 procesadores 5-issue es capaz de ejecutar un pico de 800 (!!) instrucciones por ciclo para un total de 1.2 Gflops.

El RV770 fabricado por TSMC, como sus rivales de nVidia, consta de 956 millones de transistores fabricados en el nodo de 55nm.

El RV770, con sus 800 stream processors, es la culminación del diseño y el rendimiento por mm2. Con únicamente 276 mm2 consigue prestaciones comparables al GT200 de nVidia, empaquetando 954 MTransistores en esa superficie.

El cambio más llamativo respecto al RV670 utilizado en las ATI HD3850 y HD3870 supone el gran aumento de velocidad en el proceso de antialiasing por hardware (Hardware Resolve AA) debido al masivo incremento de potencia de proceso. Parece ser que el R600 y el RV670 resolvían el AA mediante el hardware de shading, de ahí su mal rendimiento.

Las prestaciones relativas de la HD4850 respecto a la HD3870 son de un 25 al 80% según el test, un incremento espectacular pensando en su precio que ronda los 150€.

Otro cambio llanativo es el incremeto de 16 a 40 ROPs, que crecer proporcionalmente al número de procesadores:

  • El RV670 poseía 64 5 issue stream processors y 16 ROPs
  • El RV770 aumenta a 160 5 issue stream processors y 40 ROPs

45842A_RV770_Chip_3-4[1]

Dies del core RV770. Pulsa para ampliar.

Lo que personalmente me sorprende es el brutal incremento de potencia con un aumento de 666 MTransistores en el RV670 a 956 M en el RV770, pero la explicación es simple.


ATI diseñó un procesador ganador con el R600 pero le traicionó su desmesurado consumo (fruto de decisiones de ingeniería equivocadas como su doble Ring Bus de 512 bit full duplex) y tuvo que comercializarlo a frecuencias inferiores a las planeadas.

Con el RV670 ATI puso mucho énfasis en el consumo implementando tecnología de sus GPUs móviles reduciendo tanto su consumo en reposo como en carga con frecuencias y voltajes dinámicos, haciendo de la HD3870 y HD3850 uno de los chips más frugales del mercado con consumos en reposo de unos 20W.

45844A_RV770_Wafer[1]

Wafer de cores RV770. Pulsa para ampliar.

Con todas estas mejoran nVidia se ha visto obligado a reducir precios en toda su linea de procesadores gráficos, especialmente las 9800 GTX y sus nuevas GT200. Resaltar que tanto las GT200 como las 9800 GTX son mucho más caras de producir debido a que fueron concebidas para precios superiores a los 300$ y su mucho mayor complejidad.

ATI ha destrozado a su competencia de nVidia con precios de 199$ para la HD4850 y 299$ para la HD4870 para unos procesadores que entran en competencia directa con la serie más alta de nVidia, la GT200 que tiene precios desde los 400$.

AMD ha logrado integrar los 800 procesadores junto con gran cantidad de hardware especializado, espacio de registros y cachés en solo 256 mm2 en TSMC 55nm. Compárese con la monstruosa superficie de 576 mm2 (!!) de nVidia GT200 en TSMC 65nm.

45845A_ARPG_Chip_Shot_Side[1]

El RV770 tal como lo veremos en las tarjetas gráficas.

Aquí tenéis un par de demos e la potencia del nuevo procesador, que las disfrutéis:

http://download.amd.com/Corporate/AMD_RUBY_S04.mov

http://download.amd.com/Corporate/Cinema/AMD_FINCHER_HD.mov

Es increíble lo que se puede hacer con 800 procesadores (!!).

Un fallo obvio en la generación HD2900 y HD3800 era su bajo rendimiento relativo aplicando AA (), este defecto se ha solucionado magistralmente en la serie HD4800.

Sin duda va a ser un líder de ventas, va a arrasar las series 8800 y 9800 de nVidia y entra en competencia directa con la serie GT200, en concreto con el modelo GT260 que deberá reducir su precio de venta.

Recordemos que nVidia todavía fabrica el GT260 / GT280 en tecnología de 65nm con una superficie de 576mm2 siendo muy costosa su fabricación. Sin duda más del doble que el nuevo chip de ATI, por lo que a nVidia le será difícil reducir mucho su precio.

Se avecinan buenos tiempos para el usuario en el mundo gráfico, la competencia siempre es positiva para el mercado.

Esperemos que en el terreno de los procesadores AMD consiga mejorar su posición con su núcleo Shanghai y podamos asistir a un escenario menos monopolista que el actual dominado por Intel con sus procesadores Core2.

Etiquetas de Technorati: ,,,

martes, 24 de junio de 2008

Resultados: Tu procesador actual

Cerrada la encuesta pasamos a analizar los resultados, para un total de 38 votos. ha quedado del siguiente modo:

TuCPU

En cabeza el Core 2 Duo y el Athlon 64 X2 con 14 y 13 votos respectivamente, ambos son claramente los líderes de ventas actualmente y se pueden adquirir por precios bajísimos.

Les siguen los portátiles Centrino y los ya venerables Athlon XP con 9 votos cada uno.

Y un empate técnico en el segmento quad core, el AMD Phenom y el Core 2 Quad obtienen ambos 7 votos.

En el segmento portátil destacar que Intel Centrino bate a AMD Turion64 por 9 contra 5.

Entre las CPUs ya antiguas destacan el ya comentado Athlon XP con 9 votos, los Pentium 4 con 7 votos y  los Athlon 64 y Pentium D con 4 votos.

Pensad que la encuesta era multiopción, es decir se puede seleccionar más de un procesador.

La media de votos por votante ha sido de 2.08. 38 votantes han seleccionado 79 procesadores. Es decir, cada votante tiene de media "en activo" algo más de dos sistemas.

Por marcas:

  • AMD: 38 votos (un 48%)
  • Intel: 41 votos (un 52%)

Gracias por participar a todos.

Etiquetas de Technorati: ,,,

sábado, 21 de junio de 2008

Lo nuevo de AMD: BGA CPU

Parece que el fabricante con base en Dresden va a desarrollar un procesador destinado a MIDs, UMPCs y portátiles del segmento del exitoso Asus Eee PC.

AMD, debido a sus dificultades económicas no puede permitirse como su rival, Intel Corp, diseñar un nuevo procesador desde cero y por ello ha adaptado el conocido Athlon64 a los requerimientos de los dispositivos móviles.

amd-bgacpu

Basado en el núcleo Athlon64, aquí tenéis los detalles:

  • Arquitectura de 64 bit
  • Controladora de memoria de un canal DDR2 400
  • Bus HyperTransport @ 800 MHz
  • L1i 64 KB, L1d 64 KB
  • Frecuencia 1 GHz
  • TDP 8W
  • Encapsulado 27 x 27 mm y 812 pines

Las medidas de AMD para reducir el consumo respecto al Athlon64 del que deriva son:

  • Reducción drástica de la frecuencia de núcleo a 1 GHz
  • Reducción del multiplicador de HT a 4
  • Se prescinde del segundo canal de memoria
  • Reducción de la frecuencia máxima de la DDR2 de 800 a 400 MHz
  • Reducción del tamaño de L2 a 256 KB

Todas estas medidas permitirán al fabricante reducir considerablemente el voltaje de núcleo con el consiguiente ahorro energético y ampliación de la vida de la batería en los dispositivos a los que va dirigido.

Muy probablemente sea un dispositivo de 65 nm, aunque depende de cuando salga al mercado. El sentido práctico indica que será de 65 nm y no 45 nm pues AMD ya dispone hace tiempo de cores Athlon 64 Brisbane de 65 nm, la dificultad de diseño disminuye drásticamente.

Deberá competir con los Intel Celeron-M y Atom y con los VIA Nano y C7-M:

  • El Intel Celeron-M es un procesador single core basado en la arquitectura Core2, con altas prestaciones por ciclo, FSB de 533 MHz  y 1 MB de L2. Sus TDP rondan los 27 a 31 W.
  meromdieim
  • El Intel Atom es una microarquitectura totalmente nueva, diseñada específicamente en cada detalle para reducir al mínimo indispensable el consumo. Integra SMT y habrá versiones dualcore. Su TDP mínimo es de 2W (!!).

 

  • El VIA C7-M es un chip ya veterano de VIA. Se presenta en dos versiones C7-M con TDPs de 12 a 20W y C7-M  ULV con TDPs de 3.5 a 7.5 W y está fabricado en el nodo de 90 nm.
VIA C7-M Mobile Processor LogoVIA C7-M Mobile Processor
  • El VIA Nano es un nuevo diseño de VIA en 65 nm. Es un núcleo de altas prestaciones, por ahora single core. Cuenta con 1 MB de L2 y TDPs de 5 W a 1 GHz y 25 W a 1.8 GHz.

Image1

Sin olvidar los nuevos nVidia Tegra basados en arquitectura ARM11.

[8267_nvidiategradt12.jpg]

La competencia es el mayor estímulo del progreso y está claro que en los dispositivos móviles va a haber una verdadera revolución a la que ya estamos asistiendo.

Etiquetas de Technorati: ,,,

miércoles, 18 de junio de 2008

Los tres canales de Nehalem

He dedicado varios artículos ya a Nehalem, el sucesor de la exitosa saga Core2:

 

En ellos he intentado ir desgranando la características más importantes de esta nueva arquitectura.

Estoy seguro que este diseño va a marcar época y mucho van a tener que espabilar los competidores de Intel para hacerle frente.

Aquí quería arrojar un poco de luz sobre la motivación de sus diseñadores de incluir tres (!!) canales DDR3 en el diseño del procesador.

Puede haber dos razones:

  • Aumentar el ancho de banda. Personalmente estoy convencido de que con dos canales DDR3 @ 1600 Nehalem estará de sobra servido (dando un ancho de banda agregado de 25.6 GB/s).
  • Reducir la latencia y posibilitar lecturas y escrituras concurrentes.

Sin duda la motivación del triple canal, tres controladoras de memoria independientes, es la reducción de latencia.

Esta reducción pondrá a Intel a la cabeza en latencia de acceso a memoria en el mercado de consumo y portátil pero más importante todavía en el lucrativo segmento de estaciones de trabajo y servidores.

lunes, 16 de junio de 2008

Encuesta: ¿Cual es tu CPU actual?

Me pareció muy interesante la encuesta de C.A.U. acerca de software antivirus.

El  interés, para mí, radica en que es la opinión de personas que en principio saben de que hablan y tienen formación para elegir el antivirus más adecuado.

No son opiniones de meros usuarios, sino de expertos.

Y por eso ha pensado que sería buena idea plantear la siguiente encuesta sobre el procesador que actualmente albergan vuestros equipos.

Y digo equipos porque por regla general, tenemos más de uno.

A modo de ejemplo, yo tengo los siguientes en funcionamiento:

  • Un C2Q @ 3.2 GHz
  • Un  A64 X2 @ 2.5 GHz
Etiquetas de Technorati: ,,,,

jueves, 12 de junio de 2008

30 años de arquitectura x86

Este domingo se cumplieron 30 años de la introducción del primer procesador x86, el famoso 8086.

Die del procesador 8086

Intel C8086

Uno de los encapsulados del chip

Fue introducido con una frecuencia de 4,77 MHz, era un procesador de 16 bit y contaba con 29000 transistores.

Introdujo la arquitectura x86, que pese a sus muchas desventajas, nos sigue acompañando y se extiende cada vez a más segmentos de mercado.

Etiquetas de Technorati: ,,,,

domingo, 8 de junio de 2008

Datos finales sobre Intel Nehalem

Por fin tenemos datos reales y fiables de las latencias de la nueva microarquitectura de Intel: Nehalem.

Latencias de cachés:

  • L1 32 + 32 KB: 4 ciclos
  • L2 256 KB: 11 ciclos
  • L3 8192 KB: 39 ciclos (quizás sea variable)

Caché L2 256KB 8 vías:

La latencia L2 se me antoja alta comparada con Penryn que goza de una L2 de 6 MB con una latencia de solo 15 ciclos. Yo personalmente esperaba unos 10 ciclos, finalmente han sido 11, se me antoja alta pensando en la maestría de Intel en cachés.

Quizás los 11 ciclos tengan que ver con HT, o más bien con el hecho de que la latencia L1 ya son 4 ciclos que se añaden a la latencia propia de L2 (que en este caso son solamente 7 ciclos, valor realmente brillante).

Si lo comparamos con AMD sale mejor parado pues la latencia L2 de Phenom es todavía superior.

Caché L3 8 MB 16 vías:

Destacar el brillante acceso load to use de 39 ciclos para una L3 de 8 MB y asociatividad de 16 vías.

Controladoras de memoria:

Nehalem integrará, según versiones, dos o tres controladoras de memoria de 64 bit DDR3 a 1066 / 1333 / 1600 MHz.

Esto es un ancho de banda brutal y muy superior a su antecesor Core2 y al AMD Athlon64 o AMD Phenom.

Anchos de banda reales:

  • Core 2 con FSB 1066 y dual DDR3 1600: 8 GB/s
  • Core 2 con FSB 1333 y dual DDR3 1600: 10.6 GB/s
  • Athlon64 6400+ con dual DDR2 800: 12.8 GB/s
  • AMD Phenom 9850 con dual DDR2 1066: 16 GB/s
  • AMD Phenom 9550 con dual DDR2 1066: 14.4 GB/s
  • Nehalem con dual DDR3 1600: 25.6 GB/s (!!)
  • Nehalem con triple DDR3 1600: 38.4 GB/s (!!!)

Tened en cuenta que muchas veces hay limitaciones internas en el procesador que impiden llegar al ancho de banda teórico de la memoria.

Prestaciones:

Debido a que Nehalem integra SMT (HyperThreading) y su masivo ancho de banda es de esperar que la mejora respecto a Penryn (que ya es líder en prestaciones) sea abultada.

Podemos esperar de un 10 a un 40% en circunstancias normales y en casos puntuales mejoras superiores al 100% (situaciones en las que resaltan las pocas limitaciones de Penryn).

Intel ha diseñado un procesador ganador y a finales de año estará en el mercado, esperemos que AMD con Shanghai obre un milagro y al menos mantenga la competencia en algunos segmentos de mercado.

sábado, 7 de junio de 2008

Conferencia de Frank Drake

Drake_Frank_exAyer tuve el  honor de asistir a una conferencia del célebre astrónomo y padre del proyecto SETI, el Dr. Frank Drake.

seti-header_01 

Como director del Instituto Carl Sagan SETI Center lidera la investigación en el campo de la búsqueda de vida extraterrestre mediante radiotelescopios y telescopios ópticos.

ao011_400

Como el radiotelecopio de Arecibo, Puero Rico, el mayor del mundo.

ao005

Antena-detector de Arecibo.

La célebre ecuación de Drake, para calcular el número de civilizaciones inteligentes en nuestra galaxia, La Vía Láctea:


N = R* • fp • ne • fl • fi • fc • L

N = The number of civilizations in The Milky Way Galaxy whose electromagnetic emissions are detectable.

R* =The rate of formation of stars suitable for the development of intelligent life.

fp = The fraction of those stars with planetary systems.

ne = The number of planets, per solar system, with an environment suitable for life.

fl = The fraction of suitable planets on which life actually appears.

fi = The fraction of life bearing planets on which intelligent life emerges.

fc = The fraction of civilizations that develop a technology that releases detectable signs of their existence into space.

L = The length of time such civilizations release detectable signals into space.

Ahora se está acabando el nuevo Allen Telescope Array (en honor al cofundador de Microsoft, que ha aportado gran parte de los fondos).

ATA_pix1_400Empezará a operar este verano, y  a diferencia del radiotelescopio de Arecibo, será exclusivamente para uso del instituto SETI.

Sobre la conferencia, no me extenderé para no aburrir a nadie (este blog no es el sitio adecuado), pero debo decir que ha sido un placer escuchar en su propia voz ideas y hechos que tantas veces he leído o visto en fotografías de la NASA.

Sin duda una auténtica suerte y un placer.

Animaros a participar en Seti@Home.

jueves, 5 de junio de 2008

AMD lanza la plataforma Puma

PrintPor fin, aunque con retraso, la esperada línea de procesadores del fabricante con base en Dresden para portátiles llega al mercado.

Image1

Documento de AMD sobre la nueva plataforma.

griffin_core

El die de Griffin dualcore. Pulsa para ampliar.

La plataforma Puma está compuesta del core Griffin (dualcore) con dos cachés de 512 KB y optimizaciones para reducir su consumo, pensemos que es un Athlon64 X2 modificado, junto con chipsets también de AMD y chips gráficos AMD / ATI.

puma_platform

La plataforma Puma al completo. Pulsa para ampliar.

A la izquierda vemos el procesador Griffin, fabricado en el nodo de 65 nm SOI de AMD en la Fab36

Image6

Como vemos se ha puesto énfasis en la movilidad y duración de batería, y como en Phenom, el reloj de cada core es independiente.

Incluso es posible desactivar dinámicamente uno de los núcleos y cuenta con un bus HT3 y controladora de memoria optimizada para bajo consumo.

Recordar que en los A64 y Phenom únicamente el consumo de la controladora de memoria integrada supone hasta un 30% del total.

Image2

Comparación de velocidad en 3DMark 2006 de Puma respecto a Centrino con gráficos integrados.

Image3

Comparación en reproducción de vídeo HD HQV.

Image4

Comparativa de velocidad wireless, AMD cuenta con un flamante chipset Atheros (!!)

Image5

Con ATI PowerXpress podemos elegir entre prestaciones o duración de batería.

En breve veremos los primeros portátiles con estos nuevos procesadores, AMD los seguirá llamando Turion X2 y Turion X2 Ultra.

martes, 3 de junio de 2008

nVidia Tegra para dispositivos móviles

La nueva línea de procesadores gráficos de nVidia integra un núcleo ARM11 MPCore junto con hardware 2D/3D y vídeo hasta full HD 1080p.

NVIDIA GoForce: Unlocking New Generation of Smart Phones.

Página de nVidia sobre los nuevos procesadores Tegra.

NVIDIA APX 25008267_nvidiategra-dt[1]

Dispositivos móviles en los que se prevé integrar estos procesadores.

Habrá dos series diferenciadas por sus prestaciones y su consumo:

  • Tegra 600 y 650. La gama alta. Full HD 1080p, para MIDs (mobile internet devices) con potencia 2D/3D de escritorio y según nVidia un consumo 10x inferior a la competencia.

Image1

  • Tegra APX 2500. Hasta 720p en captura y reproducción.

nVidia promete prestaciones de navegación por internet y servicios WEB 2.0 comparables a un sobremesa.

Sin duda serán grandes procesadores, la única duda es su consumo, pero si las promesas se cumplen será un verdadero éxito.

Soportarán Windows CE y Windows Mobile y se espera su entrada en el mercado para finales de 2008.

Etiquetas de Technorati: ,,,,,,,

lunes, 2 de junio de 2008

El procesador VIA Nano

VIA ha diseñado por fin un procesador competente con un núcleo de ejecución out-of-order, unas unidades de coma flotante competentes, arquitectura de 64 bit y unidades SSE de baja latencia.

IsaiahDiePlot

VIA nos tenía acostumbrados a CPUs realmente mediocres, VIA C3, VIA C7, VIA C7M, ... su única baza era su bajo consumo. Pocos transistores que ejecutan poco trabajo no pueden consumir mucho ...

Image1

... con el core Isaiah la división Centaur Technology de VIA Austin ha rediseñado todo el core, huyendo de las arquitecturas simples descendientes de los antiguos Ciryx que daban un rendimiento terrible sin paliativos.

henry_VIA

Image3

Isaiah es un core de diseño moderno y bien compensado con unas L1 de 64 KB y 16 vías y una L2 de 1 MB (16 vías) y un consumo TDP realmente bajo. Sus velocidades de reloj irán de 1 a 1.8 GHz.

Las caches son de arquitectura exclusiva, como en AMD.

Image5

Habrán dos series:

  • Serie L: Low power
  • Serie U: Ultra low power

El único problema es que deberá competir con los dual cores Intel Atom.

En primera aproximación puedo decir que un core Isaiah a igualdad de reloj será superior a un Silverthorne (Atom) SMT, pero probablemente esto cambie con la versión dual core de Atom.

Image6

Núcleo de ejecución de Isaiah.

Puede decodificar tres instrucciones x86 por ciclo, comparable a un Athlon64 pero inferior a un Core2 que descodifica cuatro.

Además es compatible pin a pin con su antecesor el VIA C7, en un encapsulado de 21 x 21 mm y con un área de 63.3 mm2.

Image8

PadLock es la tecnología de encriptación y desencriptación por hardware de VIA.

Image10

Proyecciones de prestaciones según el fabricante:

Image13

Obviamente, respecto al C7, Isaiah despliega su poderío out-of-order y lo supera sin problemas.

Image14

Lo mismo ocurre en tareas multimedia ...

Image15

... y en tests sintéticos.

Image16

Comparación con Intel Celeron M520 a 1.6 GHz.

El Celeron M 520 de Intel es un procesador Core2 65nm de un solo núcleo con 1MB de L2 y un FSB de solamente 533 MHz, es decir lo más bajo posible en arquitectura Intel.

Etiquetas de Technorati: ,,,,,,