Duelo de Titanes: AMD Ryzen Threadripper vs. Intel SkylakeX

Threadripper: Más de 4000 pines...

La rivalidad AMD Ryzen Threadripper vs. Intel SkylakeX marcará una época y subraya la vuelta a la competición en el mercado sobremesa de gama alta HEDT (high-end desktop).

Aquí analizaré ambos procesadores en detalle y expondré sus puntos débiles y fortalezas.

AMD Ryzen Threadripper, un verdadero monstruo.
AMD Ryzen Threadripper, un verdadero monstruo.

Threadripper incluso inaugura una nueva categoría, el SHED (super high-end desktop). Como experto en arquitectura de procesadores nunca en los últimos 10 años he asistido a un momento tan crucial en la historia de los semiconductores.

Los ya universales 14 nm

Para empezar quiero señalar que, por primera vez, AMD no se encuentra en desventaja en el proceso de fabricación. Recordemos que siempre ha estado rezagado uno o dos nodos por detrás de Intel (por ejemplo 65 o 45 nm vs. 32 nm de Intel).

En 2017 ambos fabricantes de procesadores x86 (Intel y AMD) manufacturan sus CPUs en el nodo de 14 nm.

El acuerdo entre Samsung y GlobalFoundries en 14nm.
El acuerdo entre Samsung y GlobalFoundries en 14nm.

AMD contrata la manufactura de sus procesadores a Global Foundries (con licencia Samsung en 14 nm) mientras que Intel fabrica sus propios chips en sus mega fabs.

¿Porqué 2017 es diferente?

Es simple: La irrupción en el mercado de los cores AMD Zen ha destruido por completo el ecosistema AMD / Intel.

Primero fueron los procesadores Ryzen 5 y Ryzen 7 de hasta 8 cores, 16 threads y 2 * 8 MB de L3 a precios imbatibles, ahora llega el monstruoso Threadripper con sus 16 cores, los Ryzen 3 de 4 cores y en breve las APU con GPU integrada y cores Zen.

Intel ha atacado duramente la arquitectura Ryzen, argumenta despectivamente que una procesador Ryzen Threadripper no es más que dos Ryzen pegados y un procesador Server AMD EPYC ‘four Ryzen desktop dies glues together’.

Veremos qué hay de cierto en estas afirmaciones y el porqué de este agrio tono en las declaraciones del omniportente gigante x86.

Pero para entender el presente tenemos que hacer un necesario paréntesis…

Un poco de historia, diez años atrás.

Corría el ya lejano año 2007 y AMD fue literalmente barrida del mapa por Intel… con una excelente CPU que no era más que dos procesadores Core 2 Duo ‘pegados’…

AMD presentó su flamante (y caro de producir) Phenom quad core de 65 nm, con 2 MB de L3 unificada y controladora de memoria integrada dual DDR2 (en un inicio, luego pasaría a la DDR3).

Recuerdo los tests de aquellos primeros procesadores Phenom.

A los pocos minutos quedó patente su pésima escalada en frecuencia (poco más de 2.6 GHz con voltajes elevados) y lo ineficiente del diseño asíncrono de su uncore  por el que pasaban todos los datos de las 2 controladoras de memoria.

AMD Phenom Barcelona 65 nm. El primer quad core nativo.
AMD Phenom Barcelona 65 nm. El primer quad core nativo.

Los 4 cores K10 que integraba Barcelona eran AMD K8 Athlon 64 evolucionados, no estaban tan lejos de los Inel Conroe del primer Core 2 Duo 65 nm. El problema radicaba en la integración.

Uno de mis análisis de la caché L3 de AMD Phenom 65 nm en 2008.
Uno de mis análisis de la caché L3 de AMD Phenom 65 nm en 2008.

La caché L3 de AMD Phenom era de solo 2 MB para 4 cores, con diseño exclusivo Victim Cache y con una latencia tan elevada que la hacía prácticamente inútil. En su día hice numerosos análisis y propuse múltiples mejoras en su diseño e implementación.

A Intel entonces sí le gustaba ‘pegar’ procesadores…

Intel, en cambio, diseño unos totalmente convencionales procesadores Core 2 Quad constituidos por 2 dies separados Conroe de 65 nm, cada una con su L2 independiente de 4 MB (2 * 4 MB) y con un arcaico bus FSB para comunicar con el resto de la máquina.

AMD Barcelona 65 nm vs. Intel Core 2 Quad Kentsfield 65 nm.
AMD Barcelona 65 nm quad nativo (un solo die) vs. Intel Core 2 Quad Kentsfield 65 nm (se aprecian los dos chips Core 2 Duo)

AMD invirtió ingentes recursos en diseñar el complejo procesador Barcelona 65 nm como un todo, un quad core nativo. Intel por su parte se limitó a integrar dos excelentes CPUs Conroe 65 nm y montarlas en un chip con una sola conexión FSB con la placa base.

Como podemos ver, fabricar un chip demasiado grande y querer integrar todo en un solo die trae problemas inesperados. Y por supuesto, un coste de manufactura muy superior a dos más chips de menor superficie.

Moraleja: Es mejor integrar varios chips menores y dotarlos con una interconexión eficaz para lograr un producto competitivo y económico que forzar la máquina y crear un procesador en los límites absolutos del diseño.

Parece que AMD aprendió la lección, aunque no en aquellos tiempos gobernados por un estúpido management.

El procesador AMD Ryzen Threadripper

AMD Ryzen Threadripper llega a finales de Agosto. Integra 2 dies (dos chips discretos) Ryzen (8 cores y 2 L3 de 8 MB) para un total de 16 cores, 32 threads, 32 MB L3 y 4 canales DDR4 todo ello interconectado por el Infinity Fabric.

Threadripper: Más de 4000 pines...
Threadripper: Más de 4000 pines…

La caché L3 se compone de 4 bancos con gestión totalmente independiente de 8 MB y 16 vías. Cada banco de 8 MB de L3 actúa como Victim Cache de las 4 cachés L2 de 512 KB de los 4 cores integrados en ese CCX. Volveré a este tema más adelante.

El gran socket de AMD Threadripper.
El gran socket de AMD Threadripper.
Infinity Fabric

El Infinity Fabric es lo que posibilita que un procesador Threadripper o un EPYC puedan mantener la capacidad de procesamiento de su masivo número cores y threads.

El Infinity Fabric que ha AMD diseñado para toda la familia de CPUs con arquitectura Zen es altamente escalable y cada uno de sus links es configurable como Infinity Fabric, PCIex o SATA dando una gran versatilidad, eso sí a costa de muchos pines y placas base complejas.

4094 pines de interconexión son necesarios en Threadripper.
4094 pines de interconexión son necesarios en AMD Threadripper.

Skylake-X, un Intel Xeon Skylake renombrado

Intel lleva ya tantos años aplastando a AMD con sus carísimas y excelentes plataformas HEDT de alta gama que a muchos les cuesta recordar los tiempos de aquellos primeros AMD Athlon FX.

Los Athlon FX se impusieron a sus homólogos de Intel
Los Athlon FX se impusieron a sus homólogos, los Intel Pentium4

Procesadores de 1 solo core con controladora de memoria integrada dual channel DDR que sumía en el ridículo a los últimos Intel Pentium 4.

Primero Intel nos sorprendió con 6 cores y 12 threads con el Intel Core i7 990X de 45 nm, con los años pasamos a 8 y finalmente a 10 cores en la anterior generación Broadwell-E 14 nm. No había competencia posible.

Pero en 2017 se ha acabado la fiesta.

Con Ryzen Threadripper, AMD pone en la mesa 16 cores y 32 threads con 4 canales DDR4. Intel queda en cuadro… ¿Cual es su mejor opción?

Intel era conocedor de los planes de AMD y tenía que plantear una respuesta organizada…

No podía diseñar una nueva familia de CPUs de sobremesa basada en los soberbios cores Skylake o Kaby Lake con un número elevado de cores y lo más importante:

Con un subsistema L3 optimizado para cargas Gaming y escritorio. Pero habría necesitado mucho más tiempo.

Die del procesador Intel Skylake-X en versión 18 cores.
Die del procesador Intel Skylake-X en versión 18 cores.

Intel jugó su única carta, renombrar sus dos gamas inferiores de chips Xeon para Servidores como Skylake-X:

  • Los procesadores Skylake-X de hasta 10 cores utilizarán el diseño Xeon LCC (Low core count).
  • Los procesadores Skylake-X de 12 a 18 cores utilizarán el diseño Xeon HCC (High core count).
Intel Skylake-X
Intel Skylake-X

Skylake-X constituye su nueva plataforma HEDT (high-end desktop) heredera de Broadwell-E hasta los 10 cores y se extiende a un nuevo mercado abierto por Threadripper:

El nuevo segmento SHED (super high-end desktop) al que pertenece Threadripper y Skylake-X llegará hasta los 18 cores y un precio por CPU Intel de hasta 2000 € (!!).

La caché L3 de Intel Skylake-X

Intel, ya hace años, tomó la decisión de cambiar el diseño L3 de sus CPUs Xeon para servidores y ha llegado en el peor momento.

El diseño L3 hasta Skylake-X es favorable a cargas de trabajo de escritorio y gaming pero empieza a escalar mal por encima de los 16 cores aproximadamente.

El diseño actual de la caché L3 hasta los Broadwell-E:

  • Organización L3 inclusiva (incluye totalmente el contenido de TODAS las cachés L2 de los cores)
  • Tamaño de 2.5 MB por core (25 MB para 10 cores, aumenta la tasa de aciertos).
  • Alta asociatividad de 20 vías (aumenta la tasa de aciertos).
  • Físicamente la L3 se encuentra distribuida en bancos de 2.5 MB junto a cada core.
  • Frecuencia hasta 3 GHz.
  • Comunicación mediante Ring Buses bidireccionales (muy baja latencia).
La arquitectura Intel Ring Bus
La arquitectura Intel Ring Bus. Baja latencia, gran tasa de aciertos.

El nuevo diseño de caché L3 en Skylake-X:

  • Organización L3 exclusiva (NO incluye contenido de las cachés L2 de los cores).
  • Tamaño de 1.375 MB por core (13.75 MB para 10 cores, menor tasa de aciertos).
  • Baja asociatividad de solo 11 vías (baja tasa de aciertos).
  • Frecuencia hasta 2.4 GHz.
  • Comunicación mediante Mesh, los cores, cachés L3, controladoras DDR4, PCIex, etc. están sobre un retículo 2D con conexión en cada punto (mayor latencia).
La nueva arquitectura Mesh de Intel
La nueva arquitectura Mesh de Intel. Máxima escalabilidad.
Intel Skylake-X. La influencia de la arquitectura L3

Para un número elevado de cores (> 16) y con cargas de trabajo Server el nuevo diseño Mesh tiene mucho sentido y es superior al anterior doble Ring Bus.

Mesh escala mejor con el número de cores y hace óptima distribución y balanceo del ancho de banda disponible entre: cores – caché L3 – controladoras DDR4 – PCIex – USB – SATA – etc.

Pero para cargas de trabajo Gaming o de escritorio es más eficiente la antigua caché L3 inclusiva con arquitectura Ring Bus y mayor capacidad y tasa de acierto que favorece la compartición de datos entre cores.

Como vemos, Intel ha tenido que dar una solución rápida a un problema con el que hace un año no contaba: competencia en gama alta.

Memorias ECC en Skylake-X (No…)

Contrariamente a AMD Threadripper, Skylake-X no soporta memoria ECC DDR4. Es un gran hándicap pensando en estaciones de trabajo de alta gama.

Continuará en la segunda parte.

Os dejo algunos artículos con análisis de los procesadores Ryzen y la arquitectura AMD Zen:

AMD Ryzen 7 – 8 cores 16 threads y 4 GHz
AMD Zen / Ryzen 14 nm – Historia
AMD Zen / Ryzen Cache
NVMe vs AHCI: Almacenamiento
AMD Ryzen, chipsets y placas base
AMD Ryzen. Últimos detalles

Hasta aquí, otro de mis artículos en informaticapremium sobre lo último en hardware, sistemas, almacenamiento, redes, programación, diseño web, recuperación de datos y actualidad del mundo de la técnica y la informática. Nos vemos en breve.

Carlos Yus Valero.

8 opiniones en “Duelo de Titanes: AMD Ryzen Threadripper vs. Intel SkylakeX”

  1. Te felicito por tu blog el cual sigo hace años, ya estaba echando de menos los analisis a Ryzen y su arquitectura, al parecer Lisa Su está haciendo un excelente trabajo como CEO de AMD.
    Lo mejor de todo es que los usuarios ganamos con esta competencia.

    Estaré atento a tu blog como siempre.

    Saludos!

    1. Cristian, ciertamente AMD está en el buen camino.

      El monopolio en altas prestaciones que ha impuesto Intel durante los últimos 11 años (desde la aparición de los procesadores Core 2 Duo) ha llevado al mercado a un estancamiento en precios y prestaciones. Solo hay que recordar que desde 2006 tenemos procesadores de 4 cores en sobremesa y las gamas mainstream de Intel por fin plantean 6 cores desde la generación 8, lo que llegará en Q3 2017 o Q1 2018 también en 14 nm. Es decir, 11 años sin aumentar el número de cores por CPU.

      Con Ryzen, AMD lo ha revolucionado todo. Ha obligado a Intel a reducir en 800$ el precio de su CPU de 10 cores (de 1800$ a 1000$ en una sola generación) y a una carrera por SKUs de hasta 18 cores. Sin duda Ryzen y Threadripper es el golpe de efecto que el progreso de la informática de consumo necesitaba.

      Tanto Intel como AMD van a entrar en una dinámica de mejores precios y muy superiores prestaciones por generación de CPUs. Para el usuario final y para la evolución de las arquitecturas es una gran noticia.

      Un saludo.

      Blog|informaticapremium – Carlos Yus Valero.

    1. Gaston.
      Si tienes un Ryzen 5 1600X y estás satisfecho imagina un Threadripper:
      16 cores en lugar de 6… Brutal!
      Eso sí serán sobre unos 1000 €. Aunque podría considerarse económico pensando que un Skylake-X de 18 cores serán 2000 €…
      Un saludo.

      Blog|informaticapremium – Carlos Yus Valero.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.