Intel fracasa con el superordenador Aurora

Por fin, y después de un largo tiempo, Intel ha terminado el superordenador Aurora, bueno, a medias, ya que únicamente tienen la mitad de unidades desplegadas. Sin embargo, esta bestia de la computación con hardware exclusivamente Intel podría considerarse casi un fracaso. ¿Por qué?

El Superordenador Aurora llega al #2 del Top 500

Intel ha conseguido que la mitad de su superordenador Aurora ya esté operativo y pueda enviar sus resultados para ser incluido en el Top 500 de las computadoras más potentes del momento. En concreto, en el número 2, dado que el primer puesto lo tiene el superordenador Frontier basado en hardware de AMD con CPU EPYC de tercera generación e Instinct MI250X como GPU.

Blade Superordenador Aurora

El hardware del superordenador Aurora es el siguiente:

  • 10.000 servidores Blade, compuestos cada uno de ellos por:
    • 2 CPU con arquitectura Sapphire Rapids, en concreto el Xeon Máx 9470 de 52 núcleos a 2 GHz con memoria HBM.
    • 6 GPU Intel Max 1550 “Ponte Vecchio“.
      • 128 Xe Cores con 16.384 ALU en FP32 en total.
      • Velocidad de reloj base: 900 MHz.
      • Velocidad de relon en Boost: 1600 MHz.
  • 8 interconexiones HPE Slingshot-11 a 200 Gb/s para interconectar los diferentes servidores.

Todo ello le permite alcanzar al superordenador Aurora una potencia de 0,585 ExaFLOPS con un consumo de 24.7 MW de potencia eléctrica. Sin embargo, es ahí donde se encuentra el problema. Y es que pese a que las cifras puedan parecernos impresionantes, la realidad es que el resultado final no es el esperado.

No se ha llegado a los objetivos de rendimiento

Intel llegó a prometer que el superordenador Aurora alcanzaría los 2 ExaFLOPS, alcanza un cuarto de la potencia esperada con la mitad del sistema desplegado y con un consumo energético que es la mitad de lo presupuestado. Tened en cuenta que en este tipo de sistemas el coste energético es uno de los presupuestos fijos a la hora de montar un sistema de este tipo.

Mentira 2 ExaFLOPS Aurora

En comparación, el primer puesto del Top 500, Frontier, alcanza los 1.2 ExaFLOPS requiriendo 22.7 MW de potencia, dicho de otra forma un rendimiento por vatio de más del doble a favor de AMD. Lo cual resulta irónico si tenemos en cuenta que el cliente de Intel es el departamento de energía de los Estados Unidos. Para colmo y para echar sal a la herida de Intel, AMD tuvo listo su superordenador hace 18 meses.

¿El culpable de esta situación? Ponte Vecchio, la FrankenGPU pensada para HPC diseñada por el ya desmantelado grupo en su día dirigido por Raja Koduri y que combina una gran cantidad de chiplets, una pieza extremadamente cara y lenta de fabricar que llega a combinar piezas fabricadas también en TSMC. Mientras que NVIDIA se cansa de vender sus A100, H100 y L40 por todo el mundo y AMD empieza a ser tenida en cuenta como alternativa, Intel con Ponte Vecchio no ha conseguido convencer más allá de contratos como el del superordenador Aurora, cuyo presupuesto ha terminado en saco roto si tenemos en cuenta la cancelación de Rialto Bridge, la versión pulida de Ponte Vecchio y que Falcón Shores no se espera hasta a 3 años vista.