Un nuevo jugador ha llegado al mundo de la inteligencia artificial y está generando una gran disrupción.
La startup china de IA DeepSeek causó revuelo la semana pasada al lanzar la versión completa de R1, su modelo de razonamiento de código abierto que supera al o1 de OpenAI. El lunes, las descargas en la App Store del asistente de IA de DeepSeek —que funciona con V3, un modelo lanzado en diciembre— superaron a ChatGPT, que hasta entonces había sido la aplicación gratuita más descargada.
DeepSeek R1 también ha escalado rápidamente al tercer puesto en la Chatbot Arena de HuggingFace, solo por debajo de algunos modelos de Gemini y de ChatGPT-4o. Sin embargo, casi tan pronto como superó a OpenAI, DeepSeek restringió los registros, argumentando un supuesto ciberataque, y luego siguió causando impacto con el lanzamiento de un nuevo modelo de generación de imágenes.
¿Qué es DeepSeek?
Fundada por Liang Wenfeng en mayo de 2023, esta startup china aún no cumple ni dos años, pero ya desafía a las grandes empresas de IA con su enfoque de código abierto. Según Forbes, su ventaja podría radicar en su modelo de financiamiento: DeepSeek solo recibe fondos de High-Flyer, un fondo de cobertura dirigido también por Wenfeng, lo que le permite un crecimiento rápido y más libertad para la investigación.
¿Qué es DeepSeek R1?
Lanzado en su versión completa la semana pasada, R1 es el modelo insignia de razonamiento de DeepSeek, capaz de igualar o superar el rendimiento del o1 de OpenAI en pruebas de matemáticas, programación y razonamiento. Lo que hace que R1 sea particularmente interesante es que, a diferencia de otros modelos de las grandes tecnológicas, es de código abierto, lo que significa que cualquiera puede descargarlo y usarlo.
Sin embargo, DeepSeek no ha revelado el conjunto de datos con el que entrenó R1. Hasta ahora, todos los modelos que ha lanzado también han sido de código abierto.
Otra ventaja de DeepSeek es que es más barato que los modelos estadounidenses equivalentes. Por ejemplo, el acceso a la API de R1 cuesta $0.14 por un millón de tokens, una fracción de los $7.50 que cobra OpenAI por el mismo nivel de servicio.
DeepSeek afirmó en un documento de investigación que el entrenamiento de su modelo V3 costó $5.6 millones, una cifra que ha sido interpretada (y debatida) como el costo total de desarrollo del modelo. Según AP, algunos expertos creen que esa cifra solo corresponde a la última fase de entrenamiento, sin incluir costos previos como infraestructura, investigación, adquisición de datos y personal, lo que significaría que el costo real es mucho mayor, aunque sigue siendo inferior al de las grandes tecnológicas.
¿Podría la censura afectar su crecimiento?
Un posible obstáculo para competir a largo plazo con o1 y otros modelos estadounidenses es la censura. Los modelos chinos suelen tener restricciones sobre ciertos temas, lo que significa que, aunque pueden ser tan funcionales como otros, podrían negarse a responder ciertas preguntas (por ejemplo, sobre la Plaza de Tiananmen o Taiwán).
En diciembre, Tiernan Ray de ZDNET comparó la capacidad de R1-Lite para explicar su razonamiento con la de o1, y los resultados fueron mixtos.
Por supuesto, todos los modelos populares incluyen controles de contenido y políticas de moderación, pero hasta ahora, los chatbots desarrollados en Estados Unidos rara vez evitan responder preguntas sobre eventos históricos sensibles.
Preocupaciones sobre privacidad
Los temores sobre privacidad de datos que rodean a TikTok —la app china de redes sociales que ha enfrentado restricciones en Estados Unidos— también están surgiendo en torno a DeepSeek.
Su política de privacidad establece:
“La información personal que recopilamos de usted puede almacenarse en un servidor ubicado fuera del país donde vive”.
“Almacenamos la información recopilada en servidores seguros ubicados en la República Popular China“.
DeepSeek recopila una amplia gama de datos, incluyendo:
- Dirección IP, identificadores únicos de dispositivo y cookies.
- Fecha de nacimiento (si aplica), nombre de usuario, correo electrónico, número de teléfono y contraseña.
- Entradas de texto o voz, prompts, archivos subidos, historial de chats y otros contenidos proporcionados al modelo.
- Pruebas de identidad o edad, así como consultas de soporte.
El documento también señala que si la empresa transfiere datos fuera del país de residencia del usuario, lo hará conforme a las leyes de protección de datos aplicables, pero no menciona el cumplimiento del GDPR (el Reglamento General de Protección de Datos de la UE).
Según Adrianus Warmenhoven, miembro del consejo de seguridad de NordVPN:
“Los usuarios deben ser conscientes de que cualquier dato compartido con la plataforma podría estar sujeto al acceso del gobierno bajo las leyes de ciberseguridad de China, que exigen que las empresas proporcionen acceso a los datos si las autoridades lo solicitan”.
Además, Warmenhoven señala que el modelo de IA de DeepSeek ha enfrentado críticas por evitar ciertos temas políticos, lo que genera preocupaciones sobre posibles sesgos y control externo en su moderación de contenido.
Por otro lado, el hecho de que R1 sea de código abierto brinda mayor transparencia, ya que los usuarios pueden analizar el código en busca de posibles riesgos de privacidad. DeepSeek también lanzó versiones más pequeñas de R1, que pueden descargarse y ejecutarse localmente para evitar que los datos sean enviados a la compañía (algo que no ocurre cuando se usa el chatbot en línea).
Cabe recordar que todos los chatbots, incluyendo ChatGPT, recopilan cierta cantidad de datos cuando se usan en el navegador.
¿Qué significa esto para el futuro de la IA?
El éxito de R1 marca un cambio importante en la industria de la IA, mostrando que laboratorios más pequeños pueden desarrollar modelos competitivos sin necesidad de recursos al nivel de OpenAI.
Por ejemplo, justo antes del lanzamiento de R1, un grupo de investigadores de UC Berkeley creó un modelo de código abierto comparable con o1-preview (una versión temprana de o1) en solo 19 horas y con un costo aproximado de $450.
Dado el enorme costo de la inversión en IA, muchos especulan que este tipo de avances podría desinflar la burbuja de la IA. De hecho, varios informes sugieren que el mercado de valores ya está reaccionando con nerviosismo.
El ascenso de DeepSeek llega en un momento crítico para las relaciones tecnológicas entre China y EE.UU., apenas días después de que entrara en vigor una prohibición parcial de TikTok en Estados Unidos. Irónicamente, DeepSeek explica abiertamente los riesgos de seguridad que el gobierno estadounidense intentó probar sobre TikTok durante años.
Vía | DeepSeek R1: La IA china que desafía a OpenAI con código abierto – Tecnología con Juancho