Home » ¿Qué sabemos de la GPU GB100 de NVIDIA? (Actualizado 24-03-2024)

¿Qué sabemos de la GPU GB100 de NVIDIA? (Actualizado 24-03-2024)

0
Jensen Huang DGX

En pocos días será la GTC, la cual se celebra cada año en estas fechas y se orienta en la computación de alto rendimiento. La mayor novedad que se espera es la tarjeta gráfica para el mercado HPC presidida por la GPU GB100 de NVIDIA. ¿Qué es lo que se sabe de este modelo? ¿Coronará a NVIDIA varios años más como la reina del hardware para la IA?

La GPU GB100 de NVIDIA será multichip

NVIDIA Multichip

Todo apunta a que la GPU GB100 de NVIDIA no estará compuesta por un solo chip, sino de dos de ellos. Sin embargo, no tenemos todavía claro si se tratará de un chip disgregado o una configuración MCM convencional, dado que hay diferencias entre ambos planteamientos que no solo se aplican en el caso de los chips gráficos, sino a todos los diseños multichip en general.

  • Cuando hablamos de una CPU o una GPU disgregada, hablamos de que un solo chip se ha dividido en varios chips distintos, por lo que cada una de las piezas no puede operar por separado al no tener la funcionalidad completa.
  • En cambio, si nos referimos a una configuración MCM, cada una de las piezas puede operar al completo de forma independiente, al tener toda la funcionalidad completa y no repartida en varias partes.

Un ejemplo del primer caso son las CPU Ryzen de AMD para escritorio, donde el IOD hace las funciones de controlador de memoria, intercomunicación y gestión de periféricos, mientras que los CCD incluyen los núcleos y las cachés correspondientes. Lo mismo ocurre en GPU con su planteamiento en los chips Navi 32 y Navi 33, donde podemos ver la funcionalidad del chip dividida entre el GCD y los varios MCD.

Ahora bien, la pregunta es saber qué tipo de configuración vamos a ver en el caso de la GPU GB100 de NVIDIA, la cual irá orientada al mercado de computación de alto rendimiento, y no para el mercado doméstico.

El plan: dejar a AMD muy atrás

Hemos de partir del hecho que hasta el momento la marca de Jensen Huang ha procurado llegar al tamaño máximo que permite un solo chip, sin embargo, las cosas se le han complicado, ya que AMD con su MI300 decidió ir a una configuración de GPU disgregada del primer tipo con la MI300, pero con el objetivo de poder ir más allá del tamaño máximo en un solo chip. ¿El resultado? La MI300.

AMD MI300 acelerador IA HPC

No obstante, buena parte de las tecnologías que hacen posible al MI300 provienen de TSMC, por lo que NVIDIA podría crear una respuesta en forma de GPU HPC que superase los 848 mm² de tamaño. ¿En qué se traduciría esto? Pues en una gran cantidad de núcleos de GPU y también en la posibilidad de ir a una configuración de 8 pilas HBM3E, lo cual combinado con el hecho de que cada una de estas será de 12-Hi, es decir, 12 chips de memoria de alto, pues podemos esperar que una tarjeta gráfica con GPU GB100 de NVIDIA alcance los 288 GB de memoria en total, todo ello aderezado de un aumento considerable del número de núcleos y con ello de rendimiento, gracias al hecho de ser un diseño multichip.

En todo caso, de lo que sí que estamos seguros es NVIDIA podría añadirle un nivel de caché adicional, el cual se encontraría en el interposer, al igual que el controlador de memoria. Mientras que cada uno de los chips incluirían una GPU completa hasta su caché L2. Por lo que nos encontraremos ante un diseño disgregado como el de la MI300, pero de mucha mayor capacidad, en especial por el uso del nodo de 3 nm de TSMC.

Requerirá refrigeración líquida

Eso sí, NVIDIA ya ha confirmado que su próxima GPU HPC de alta gama necesitará refrigeración líquida. Y es que todo apunta a que GB100 será un auténtico monstruo y se verá un salto considerable en cuanto a rendimiento respecto a las actuales H100 y H200. Se espera que la GPU GB100 de NVIDIA vaya a parar una pequeña cantidad de socios seleccionados con la capacidad de comprar esta potente tarjeta para IA en grandes cantidades, y es que el salto en potencia que se espera es bastante grande.

GPU GB100 NVIDIA, rendimiento esperado

También se espera que NVIDIA actualice su H200 con las nuevas pilas de memoria HBM3E 12-Hi para aumentar su capacidad de memoria. Por otro lado, desconocemos si veremos una versión de la GB100 menos compleja con el tiempo en forma de GB101 de un solo chip o si empezarán con dicha configuración de forma directa. En todo caso veremos que ocurre con lo que NVIDIA presentará en la GTC de este año.

Actualización a 17 de marzo de 2024

Las últimas informaciones acerca del GB100 de NVIDIA no van desencaminadas respecto a lo que os relatamos hace unos días en este mismo artículo. Al menos en lo que a un diseño de 2 GPU con 8 pilas de memoria HBM3e al estilo MI300X de AMD.

No obstante, parece ser que la primera hornada de tarjetas para IA con el chip GB100 tendrá 192 GB de memoria al usar chips HBM3E 8-Hi, dejando la configuración de 288 GB con chips 12-Hi para más adelante. En todo caso, en unos días saldremos de dudas y para aquel entonces volveremos a actualizar este artículo con toda la información completa y corregida.

5 1 vote
Article Rating
Subscribe
Notify of
guest

0 Comments
Oldest
Newest Most Voted
Inline Feedbacks
View all comments
0
Would love your thoughts, please comment.x
()
x