Se aproxima una etapa interesante para todos a los que nos interesa el hardware del PC en general. Y los microprocesadores en particular. Intel acaba de dar a conocer los detalles de la microarquitectura implementada en sus próximos procesadores Alder Lake, y tiene muchas características innovadoras. De hecho, no cabe duda de que estos procesadores encarnan la apuesta más rupturista de esta compañía en mucho tiempo.
Sabemos que Intel está trabajando en unos procesadores con arquitectura híbrida que combinan núcleos de alta eficiencia y núcleos de alto rendimiento desde que lo oficializó a principios de este año, durante la celebración de la última edición del CES. Pero apenas teníamos detalles que nos permitiesen intuir cómo encajarán estos chips en un mercado, el del PC, para el que son unos completos desconocidos. Ahora ya los tenemos.
No obstante, antes de seguir adelante y profundizar en las características de la arquitectura Alder Lake es importante que recordemos que, en realidad, esta estrategia no es nueva. Los procesadores con arquitectura big.LITTLE de ARM que podemos encontrar en nuestros teléfonos móviles implementan esta idea desde hace muchos años. Y Apple también la ha introducido en los procesadores M1 que podemos encontrar en algunos de sus equipos.
La proximidad de esta arquitectura (Intel ha confirmado que los procesadores Alder Lake llegarán antes de que finalice este año) nos invita a hacernos varias preguntas. La idea a priori es buena, de eso no cabe duda, pero implementarla para que los núcleos de alta eficiencia y alto rendimiento trabajen de forma cohesionada manteniendo la concurrencia no es trivial (todos ellos pueden llevar a cabo trabajo de forma simultánea).
Intel asegura que ha trabajado con Microsoft para que Windows 11 saque el máximo partido a estos procesadores. Y sí, es esencial que lo haga. Confiemos en que también rindan bien en Windows 10, porque, aunque se ha filtrado que el nuevo sistema operativo de Microsoft podría llegar en octubre, cuando estos chips aterricen en las tiendas la plataforma dominante aún será el actual sistema operativo de los de Seattle. En cualquier caso, esto es lo que sabemos actualmente de los microprocesadores Alder Lake.
La arquitectura Alder Lake introduce las memorias DDR5 y la interfaz PCIe 5.0
La primera diapositiva en la que merece la pena que nos detengamos refleja cuáles son los objetivos que persigue Intel con sus nuevos chips. El más importante de todos es la escalabilidad, una característica que debería conseguir que estos procesadores encajen bien en un abanico de dispositivos muy amplio actuando, sencillamente, sobre el número de núcleos de cada tipo que incorporan. Un apunte interesante: para producirlos Intel utilizará fotolitografía de 7 nm.
Como veremos más adelante, los procesadores Alder Lake están capacitados para convivir con memorias DDR5, y también con componentes que utilizan una interfaz de comunicación PCI Express 5.0. Intel se había quedado descolgada de AMD en lo que se refiere a la integración de PCIe 4.0 en sus procesadores para PC, y parece que con estos nuevos chips quiere resarcirse.
La siguiente diapositiva refleja muy bien la escalabilidad que hace posible la nueva microarquitectura de Intel. Llevar la lógica de Alder Lake a máquinas con necesidades muy diferentes únicamente requiere modificar el balance entre los núcleos de alto rendimiento y los de alta eficiencia. Apenas es necesario actuar sobre los demás subsistemas del procesador. En esta imagen podemos ver que el zócalo que utilizarán las CPU Alder Lake para equipos de escritorio será LGA 1700.
La siguiente diapositiva describe con claridad cuáles son los bloques funcionales que dan forma a la microarquitectura Alder Lake. En el extremo izquierdo podemos ver los núcleos de alto rendimiento (P-Core) y los de alta eficiencia (E-Cores). También merece la pena que no pasemos por alto la lógica gráfica Xe, que incorpora un nuevo juego de instrucciones. En el subsistema de acceso a la memoria principal indagaremos un poco más adelante.
Esta diapositiva refleja incluso con más claridad que la que hemos revisado un poco más arriba lo fácil que es para Intel adaptar las características de los procesadores Alder Lake a dispositivos con necesidades muy diferentes. Como podemos ver, el procesador para equipos de sobremesa es el que, como cabe esperar, incorporará la mayor cantidad de núcleos.
Un dato muy interesante es que los núcleos de alta eficiencia van empaquetados en grupos de cuatro y carecen de tecnología Hyper-Threading (cada uno de ellos solo puede procesar un hilo de ejecución en un instante determinado), mientras que los de alto rendimiento se empaquetan individualmente. La flexibilidad de Alder Lake en términos de escalabilidad es indudable.
Intel ha dimensionado esta arquitectura para que pueda aglutinar un máximo de 16 núcleos (8 de alto rendimiento y otros 8 de alta eficiencia); procesar simultáneamente hasta 24 hilos de ejecución o threads (como he mencionado unas líneas más arriba los núcleos de alta eficiencia no tienen tecnología Hyper-Threading); e integrar un subsistema de memoria caché con una capacidad de hasta 30 MB. Los núcleos de alto rendimiento y alta eficiencia pueden trabajar de forma concurrente.
Una de las bazas con las que contarán los próximos procesadores de Intel (aunque es probable que AMD también dé este paso muy pronto) es su capacidad de trabajar en tándem con módulos de memoria hasta DDR5-4800. No obstante, podrán convivir sin problema con módulos DDR4-3200 o inferiores, así como con los nuevos módulos LP5-5200 o inferiores, y los algo más modestos LP4x-4266. No cabe duda de que los ensambladores de ordenadores portátiles y equipos todo en uno van a agradecer esta flexibilidad.
Los procesadores Alder Lake podrán convivir con componentes que utilizan la interfaz de comunicación PCI Express 4.0, pero la auténtica novedad es que también podrán trabajar con componentes PCIe 5.0, eso sí, cuando haya alguno disponible (parece que las primeras unidades SSD que implementarán esta última interfaz de conexión llegarán el año que viene). En teoría PCIe 5.0 duplicará el ancho de banda máximo alcanzado por la interfaz PCIe 4.0, y, además, hará posible la transferencia de un máximo de 64 GB/s en aquellos chips que incorporen 16 líneas de comunicación.
La siguiente diapositiva describe la velocidad de transferencia máxima teórica alcanzada por los buses que se responsabilizan de la interconexión de los núcleos de alto rendimiento y alta eficiencia; la entrada y salida de la CPU y el subsistema de memoria principal. Como podéis ver, las cifras son bastante impresionantes, pero hasta que no podamos analizar estos procesadores en un escenario de pruebas real y no necesariamente favorable no averiguaremos si su rendimiento realmente está a la altura de las expectativas.
Así son los núcleos de alta eficiencia de Alder Lake
Según Intel la microarquitectura implementada en los núcleos de alta eficiencia prioriza la ejecución concurrente de varios hilos (uno en cada núcleo debido a que, como hemos visto, no tienen Hyper-Threading), pero balanceando simultáneamente el consumo con el propósito de minimizar el gasto energético.
No es preciso que indaguemos en los detalles más complejos de la microarquitectura de estos núcleos, pero es interesante que tengamos en cuenta que Intel asegura que la tecnología de integración utilizada en la producción de estos chips es en cierta medida la responsable del balance rendimiento/consumo de los núcleos de alta eficiencia. Será interesante ponerlos a prueba cuando estos procesadores caigan en nuestras manos.
La memoria caché de instrucciones de los núcleos de alta eficiencia tiene una capacidad de 64 KB (es una cifra respetable) y se apoya en nuevos algoritmos de gestión que persiguen incrementar la tasa de aciertos y minimizar los fallos de caché. Además, estos núcleos implementan un nuevo predictor de bifurcaciones del código más preciso, algo que cabía esperar porque es una de esas mejoras que Intel y AMD introducen en todas sus nuevas microarquitecturas.
Ahí va otro dato interesante: cada paquete de cuatro núcleos de alta eficiencia comparte un mapa de caché de nivel 2 con una capacidad máxima de 4 MB. Los ingenieros de Intel han puesto a punto un componente conocido como Intel Resource Director Technology que se responsabiliza de preservar la coherencia entre los núcleos, y, por tanto, también entre los hilos de ejecución que están siendo procesados en un instante determinado.
Como he mencionado unas líneas más arriba, Intel asegura que sus ingenieros se han esmerado en el diseño de los transistores utilizados en estos núcleos con el propósito de balancear correctamente la relación que existe entre su productividad y su consumo de energía. No debemos olvidar que los núcleos de alta eficiencia no son los responsables de entregar el máximo rendimiento posible a cualquier precio; deben rendir muy bien, pero manteniendo bajo control el gasto energético.
Según Intel los núcleos de alta eficiencia de los procesadores Alder Lake tienen un rendimiento hasta un 40% más alto que los núcleos Skylake. Y, además, consumen hasta un 40% menos de energía cuando se enfrentan a la ejecución del mismo hilo (thread). Suena bien, pero, como siempre, lo corroboraremos cuando tengamos la ocasión de probarlos a fondo en un escenario de uso real.
Los datos de rendimiento y consumo que acabamos de revisar reflejan, según Intel, la habilidad con la que los núcleos de alta eficiencia se enfrentan a la ejecución de un único hilo en solo uno de ellos. Pero esto no es lo habitual. Con frecuencia varios de estos núcleos estarán activos, y, de nuevo según Intel, en un escenario multihilo su rendimiento es hasta un 80% más alto que el de los núcleos Skylake, y su consumo hasta un 80% más bajo. Si estas cifras reflejan la realidad, que es algo que comprobaremos en su momento, los ordenadores portátiles se beneficiarán mucho de los procesadores Alder Lake.
Así son los núcleos de alto rendimiento de Alder Lake
Como acabamos de ver, los núcleos de alta eficiencia que Intel ha introducido en esta microarquitectura híbrida incorporan innovaciones interesantes, y los núcleos de alto rendimiento siguen esta misma línea. No obstante, como es lógico, estos últimos no priorizan el balance rendimiento/consumo; priorizan ante todo la productividad.
No debemos olvidar, como he mencionado más arriba, que los núcleos de alta eficiencia y alto rendimiento pueden trabajar de forma concurrente, por lo que es crucial que el algoritmo que se responsabiliza de administrarlos y balancear la carga esté bien ejecutado. Es una tarea delicada, pero no representa un reto porque ya hemos comprobado lo bien que los procesadores ARM y los M1 de Apple, que utilizan una estrategia similar, resuelven las altas cargas de trabajo sin dilapidar la energía.
Más ancha. Más profunda. Más inteligente. Así es como Intel nos vende la microarquitectura que ha implementado en los núcleos de alto rendimiento de Alder Lake. Las mejoras que ha introducido en estos núcleos persiguen maximizar el rendimiento monohilo en cada uno de ellos (no debemos olvidar que estos núcleos, a diferencia de los de alta eficiencia, sí implementan la tecnología Hyper-Threading) y minimizar la latencia. En escenarios monohilo los procesadores de Intel tradicionalmente han rendido muy bien, por lo que podemos esperar que estos chips también se sientan cómodos.
Según Intel el motor superescalar de estos procesadores ha sido diseñado para identificar las dependencias entre las microoperaciones con anticipación y con más precisión. De esta forma es posible irlas asignando a las unidades de ejecución en el orden óptimo, de manera que el número de ciclos de reloj invertido en la ejecución de cada una de ellas sea mínimo.
En palabras más sencillas lo que persigue esta estrategia es reordenar las instrucciones de modo que la CPU pueda ejecutar de forma concurrente la máxima cantidad posible de ellas, y, a la vez, minimizar el tiempo que unas deben esperar por otras cuando se produce esta dependencia.
No es necesario que indaguemos en los detalles más complejos acerca del funcionamiento de la caché de nivel 1, pero nos viene bien recordar que esta pequeña memoria es la más rápida y la que está más cerca de las unidades de la CPU que se encargan de cargar, descodificar y ejecutar las instrucciones.
Si tenemos esto presente es fácil entender por qué Intel nos dice que la caché de nivel 1 de los núcleos de alto rendimiento es más ancha, más profunda y más inteligente. A grandes rasgos nos está queriendo decir que su dimensión y el algoritmo que la administra persiguen minimizar el tiempo invertido en la carga de la caché (latencia), y también reducir los fallos de caché de los que hemos hablado unas líneas más arriba.
La caché de nivel 2 persigue los mismos objetivos que la caché de nivel 1, pero es más grande, y también un poco más lenta. Su capacidad oscila entre los 1,25 MB de los núcleos de alto rendimiento integrados en los procesadores Alder Lake para PC y los 2 MB de los núcleos que conforman las CPU para centros de datos.
Esta característica refleja una vez más que Intel ha desarrollado estos procesadores con el propósito de favorecer la máxima escalabilidad posible, lo que debería permitirles encajar bien en dos máquinas tan diferentes como son un portátil ultraligero y un equipo integrado en un clúster de un centro de computación de alto rendimiento.
Para cerrar el artículo es interesante echar un vistazo al rendimiento de los procesadores Alder Lake comparándolos con la productividad que arrojan los chips Intel Core de 11ª generación. Esta gráfica nos la ha proporcionado la propia Intel, por lo que lo más prudente es que tomemos ese 19% de incremento del rendimiento, que, obviamente, favorece a los nuevos procesadores de esta compañía, con puntillas. Con muchas puntillas. Saldremos de dudas cuando tengamos la oportunidad de probarlos a fondo en nuestras propias instalaciones.
Ver 42 comentarios