• 30 enero, 2025

Carlos Garsés

Profesional IT

DeepSeek V3: La ingeniería detrás de una IA eficiente y revolucionaria

Ene 30, 2025

La publicación del modelo V3 de la inteligencia artificial (IA) DeepSeek como código abierto es una bendición. Y lo es debido a que poco a poco vamos conociendo con detalle la estrategia que han pergeñado los ingenieros de esta compañía china para poner a punto un modelo de IA tan eficiente. Antes de seguir adelante con este artículo es importante que tengamos presente que DeepSeek asegura que ha entrenado su modelo utilizando tan solo 2.048 chips H800 de NVIDIA.

Algunos analistas defienden que, en realidad, su infraestructura aglutina 50.000 GPU H100 compradas a través de intermediarios, pero por el momento es solo una conjetura. Este chip es más potente que el H800, pero es perfectamente creíble que DeepSeek se haya visto obligada a conformarse con este último debido a que las sanciones del Gobierno de EEUU han impedido el acceso de las empresas chinas a la GPU H100. De hecho, desde noviembre de 2023 NVIDIA tampoco puede entregar a sus clientes chinos su chip H800.

Una de las claves del éxito de DeepSeek se llama PTX

En la receta del trepidante crecimiento que ha experimentado NVIDIA durante los últimos cinco años no intervienen solo sus GPU; la tecnología CUDA (Compute Unified Device Architecture) también tiene un rol esencial en su negocio. La mayor parte de los proyectos de IA que se están desarrollando actualmente están implementados sobre CUDA. Esta tecnología aglutina el compilador y las herramientas de desarrollo utilizados por los programadores para desarrollar su software para las GPU de NVIDIA, y reemplazarla por otra opción en los proyectos que ya están en marcha es un problema.

Huawei, que aspira a hacerse con una porción importante de este mercado en China, tiene CANN (Compute Architecture for Neural Networks), que es su alternativa a CUDA, pero por el momento CUDA domina el mercado. Además, esta herramienta de NVIDIA pone en las manos de los programadores un lenguaje de alto nivel que les permite acceder al hardware de la GPU de una manera asequible. Aun así, y llegamos al corazón de este artículo, los ingenieros de DeepSeek no han empleado CUDA para desarrollar su IA: han utilizado PTX (Parallel Thread Execution).

Los ingenieros de DeepSeek han decidido utilizar PTX para sacar el máximo partido posible a las GPU H800 que tenían en su poder

Este lenguaje es similar al ensamblador. De hecho, de alguna manera es el ensamblador que propone NVIDIA a los desarrolladores que utilizan sus GPU y necesitan implementar optimizaciones de bajo nivel en su código. Programar con PTX es más difícil y laborioso que hacerlo con CUDA, pero conlleva la ventaja de que permite a los desarrolladores escribir un código más eficiente, y, por tanto, capaz de aprovechar mejor los recursos que les ofrece el hardware de la GPU.

Presumiblemente los ingenieros de DeepSeek han decidido utilizar PTX para sacar el máximo partido posible a las GPU H800 que tenían en su poder. Una de las estratagemas que han ideado ha consistido en asignar solo 20 SM (Streaming Multiprocessors) de cada GPU a la comunicación entre los servidores, lo que les ha permitido dedicar los 112 SM restantes de cada chip a procesos de cálculo. En esencia, DeepSeek ha sido construido desde cero recurriendo a este tipo de optimizaciones, lo que en gran medida explica por qué este modelo de IA es tan eficiente.

Los programadores de esta compañía china objetivamente han materializado un logro en el ámbito de la ingeniería que con toda probabilidad va a tener un impacto profundo en la forma en que los desarrolladores de modelos de IA van a afrontar sus proyectos en el futuro. Esta es la prueba palpable de que China se está adaptando con éxito a la escasez de GPU que han desencadenado las sanciones de EEUU en sus empresas.

Vía | DeepSeek V3: La ingeniería detrás de una IA eficiente y revolucionaria – Tecnología con Juancho

Por Juan Padra

Más de 40 años de experiencia en tecnología. DJ, enseñanza del español y radio en línea. Profesional versátil y apasionado de la música y la tecnología. ¡Bienvenido a mi perfil!

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Verificado por MonsterInsights