Intel vuelca la mesa con su nueva arquitectura gráfica Xe2
Mejoras función fija Xe2
La presentación de Lunar Lake por parte de Intel nos ha dado un torrente de información enorme, no solo de los núcleos Lion Cove y Skymont, sino también de la nueva gráfica integrada, la cual recibe el nombre de Xe2. Esta se utilizará en las aún no anunciadas tarjetas gráficas ARC Battlemage y en futuras CPU de la marca como Panther Lake, pero no se encuentra en Arrow Lake. Pues bien, desde su presentación en la Computex de 2024 hemos podido saber una gran cantidad de nuevos datos.
Índice de contenidos
Intel Xe2, ¿reivindicación o el canto del cisne de Intel en GPU?
Los cambios que Intel ha hecho en la arquitectura gráfica Xe2 son tantos que no podemos considerarla como una mejora incremental respecto a la primera generación, sino como un borrón y cuenta nueva que supone un salto de rendimiento importante. Paradógicamente, al igual que ocurrió en AMD tras la marcha de cierto ingeniero hindú, con la presente GPU ha ocurrido lo mismo. Por lo que podemos considerarlo equivalente al salto que hubo de GCN a RDNA, pero esta vez en Intel.
Y podemos decir que al igual que con Skymont no nos esperábamos este cambio por parte de Intel, Y es que mientras AMD habla de una mejora en rendimiento del 36% respecto a Meteor Lake en sus nuevos Ryzen 300 AI, Intel afirma que han llegado a alcanzar un 50% respecto a la misma arquitectura en la GPU integrada de Lunar Lake. Por lo que puede, y a falta de confirmar el rendimiento en juegos, que la marca azul se haya puesto por delante de su rival.
Por el momento la única prueba de rendimiento de la nueva arquitectura Xe2 que tenemos la podemos ver en F1 2024 ejecutándose en Lunar Lake, donde han conseguido que funcione a 1080p, 60 FPS y con Ray Tracing en Lunar Lake. Eso sí, utilizando Intel XeSS en el proceso, pero el Ray Tracing activo.
Nueva arquitectura, nuevo núcleo
El Primer cambio importante en Xe2 ha sido la implementación de un nuevo núcleo de GPU que reorganiza los elementos que ya vimos en la primera generación. Con el objetivo de aumentar el rendimiento a través de una mayor utilización de los recursos. Y es que ha habido una reorganización, donde hemos pasado de tener 16 unidades SIMD8 de 256 bits a 8 con el doble de longitud. Por lo que en realidad no estamos ante duplicar la potencia de cálculo a lo bruto, sino ante un diseño mucho más inteligente.
Cada XVE Está compuesto por una unidad SIMD16, de 512 bits de longitud (FP32*16), una unidad SIMD de enteros del mismo tamaño, 2 unidades FP64 para el cálculo en coma flotante de doble precisión y 4 unidades especializadas el cálculos complejos como son logaritmos, razones trigonométricas, raíces cuadradas, potencias y cálculos logarítmicos.
Todo ello se traduce en que pese a que aparentemente hay menos núcleos de GPU, la potencia de cálculo es muy superior. No en vano, bajo la nueva configuración y con la mitad de consumo energético, la versión más modesta que es la incluida en Lunar Lake consigue un aumento de rendimiento del 50%. Y todo gracias a los cambios que Intel ha implementado en cada uno de los núcleos de la arquitectura.
El XMX la respuesta a los Tensor Cores de NVIDIA
Uno de los elementos clave de cara al futuro de las GPU es el Machine Learning y el Deep Learning y para ello son necesarios lo que llamamos arrays sistólicos, unidades matriciales o Tensor Cores. Da igual el nombre, todo es lo mismo y XMX significa Xe Matrix Extensions. Y se puede decir que no solo las unidades SIMD han recibido un importante lavado de cara.
Y es que si bien las NPU dentro de las CPU se han puesto de moda últimamente, la realidad es que en ciertos niveles de rendimiento es necesaria una GPU con este tipo de unidades. Algo que se ha hecho palpable después de que NVIDIA haya subido su valor en bolsa hasta la estratosfera por el boom de la IA generativa. ¿Lo malo para Intel? Que en la primera generación tenían todas las piezas necesarias, al contrario que AMD, y en Xe2, al igual que ocurre con las unidades SIMD dentro de los núcleos, estas también han duplicado su capacidad de cálculo.
Más allá de los núcleos, el Render Slice de Xe2
Uno de los cambios que ha hecho Intel en la nueva arquitectura es separar la unidad de función fija del Ray Tracing de lo que es el Xe2 Core. De tal manera que en cada Render Slice tenemos no solo los diferentes núcleos de la GPU. Y esto es una novedad por el hecho que hasta el momento, y en el caso también de las otras marcas, las unidades para el trazado de rayos al encontrarse dentro del núcleo principal compartían ciertos recursos, especialmente caché y memoria local, con el resto de unidades.
Esta decisión tiene sentido y es parte de lo que le permite a Intel tener un Xe2 Core universal para todo tipo de GPU, ya que el Ray Tracing no es un elemento que se demande en todos los mercados. De esta forma lo tienen mucho más fácil para crear soluciones a medida. Sin embargo, este no es el único cambio realizado en lo que a la organización del Render Slice se refiere, el cual suele agrupar varias unidades de función fija, por no hablar de la intercomunicación entre núcleos y los diferentes elementos de la GPU, así como de las latencias internas de comunicación.
Cambios importantes en función fija y el controlador de memoria.
Y es que Intel, en el caso de Xe2, ha tocado todos los puntos de su arquitectura gráfica, no se ha limitado a trasladar a una mejor litografía el diseño de la primera generación y a mejorar solo los núcleos. Y es que tenemos cambios importantes como:
- Ejecución indirecta por hardware, la cual tenía que ser emulada en la anterior generación y suponía perdidas de rendimiento importantes. Se trata de algo que es crucial para títulos futuros basados en Unreal Engine 5.
- Han incrementado el rendimiento de las unidades de función fija, incluida la de Ray Tracing.
- El rendimiento en Mesh Shading es ahora 3 veces superior, al igual que el pipeline geométrico también.
- El ancho de banda interno se ha duplicado
- Mejoras en las unidades de Ray Tracing, las cuales no solo pasan a estar desacopladas y a tener su propia caché,
- Los problemas derivados del controlador de memoria también se han resuelto.
Buena parte de los cambios en Xe2 vienen por el hecho que en la primera generación buena parte de la responsabilidad recayó encima de los drivers, provocando un mal rendimiento inicial. La nueva generación, en cambio, implementa buena parte de esas funciones por hardware y si bien se beneficia de la madurez de los drivers actuales, también se quita del medio la dependencia de los mismos.
equivalente a rdna 3?
[…] podemos pensar mal y llegar a la conclusión de que ciertos cambios han colocado a la Tile GPU Xe2 algo por encima, pero no hemos de olvidar que el AMD Ryzen 300 AI puede alcanzar niveles de TDP y […]