Eos es uno de los superordenadores más capaces del planeta en el ámbito de la inteligencia artificial (IA) generativa. Lo ha diseñado y construido NVIDIA presumiblemente para uso propio, aunque con toda probabilidad uno de sus propósitos es actuar como máquina de referencia que puede ser clonada por NVIDIA para otras compañías que necesitan una infraestructura de supercomputación especializada en IA.
Las cifras que reflejan el rendimiento de este superordenador son impactantes. Sus 121,40 PFlop/s (Rmax) y 188,65 PFlop/s (Rpeak) lo colocan como el noveno superordenador más potente del mundo por detrás de máquinas como Frontier, Aurora, Eagle o Fugaku. Curiosamente justo delante de este superordenador de NVIDIA y en la octava posición de la clasificación TOP500 reside MareNostrum 5, el superordenador más potente que tenemos en España.
Esta es la receta del que posiblemente es el superordenador para IA más potente
Según NVIDIA Eos entrega una potencia de 18,4 exaflops en aplicaciones de inteligencia artificial. Es una auténtica barbaridad. No es fácil poner en contexto esta cifra, pero puede ayudarnos reparar en que esta máquina aglutina nada menos que 576 plataformas DGX H100, y cada una de ellas incorpora ocho GPU H100, por lo que Eos tiene un total de 4.608 chips H100 de NVIDIA. Esta mastodóntica GPU con microarquitectura Hopper está fabricada por TSMC en su nodo de 4 nm y condensa nada menos que 80.000 millones de transistores.
Eos aglutina nada menos que 576 plataformas DGX H100, y cada una de ellas incorpora ocho GPU H100
No obstante, aunque esta GPU de NVIDIA es la auténtica protagonista de este superordenador si nos ceñimos a sus especificaciones es importante que no pasemos por alto que en esta máquina trabaja codo con codo con 1.152 procesadores Intel Xeon Platinum 8480C. Cada una de estas CPU de propósito general tiene 56 núcleos y contribuye de una forma decisiva a la espectacular productividad que arroja esta máquina en el ámbito de la computación de alto rendimiento.
En cualquier caso, en la receta utilizada por NVIDIA para poner a punto este superordenador aparecen dos ingredientes más que merece la pena que no pasemos por alto. El primero de ellos es la arquitectura DGX SuperPOD, una plataforma diseñada expresamente por la compañía liderada por Jensen Huang para simplificar la puesta a punto de infraestructuras para centros de datos que sean fácilmente escalables. En teoría para NVIDIA sería sencillo poner a punto un superordenador similar a Eos pero integrado por una cantidad mayor de sistemas DGX H100.
El último ingrediente de la receta que ha dado lugar a Eos en el que merece la pena que nos detengamos es la tecnología Mellanox Quantum-2 InfiniBand de NVIDIA. Se trata de una arquitectura de comunicaciones en red de alto rendimiento diseñada para optimizar la transferencia de datos entre los nodos de una red, y no cabe duda de que es en cierta medida responsable del rendimiento de este superordenador. NVIDIA no ha desvelado cuánto le ha costado construir Eos, pero podemos hacernos una idea aproximada, aunque no del todo certera, si tenemos presente que cada sistema DGX H100 cuesta entre 30.000 y 40.000 dólares dependiendo de la cantidad adquirida.