Hoy OpenAI anunció que se está asociando con el Financial Times para hacer que los artículos del prestigioso periódico sean accesibles para sus grandes modelos de lenguaje.
Como parte de la colaboración, las empresas pondrán cierto contenido del Financial Times a disposición de los usuarios de ChatGPT. OpenAI dijo que el acuerdo cubre “resúmenes atribuidos seleccionados, citas y enlaces al periodismo del FT”. No especificó cuándo el contenido estará disponible ni en qué versiones de ChatGPT.
Además de traer artículos del Financial Times al chatbot, OpenAI también utilizará el contenido para entrenar nuevos modelos de IA. El acuerdo es parte de un esfuerzo más amplio de la empresa para mejorar sus Modelos de Lenguaje Grandes (LLM) usando conjuntos de datos de entrenamiento de terceros. En noviembre pasado, OpenAI lanzó un programa de socios diseñado para dar acceso a sus LLM a repositorios de información externa “que reflejen la sociedad humana”.
OpenAI no reveló los términos del acuerdo con el Financial Times. En diciembre, después de firmar un acuerdo de licencia similar con Axel Springer, el Wall Street Journal informó que se esperaba que el contrato generara “ingresos sustanciales” para la editorial alemana. Al igual que el Financial Times, Axel Springer le dio a OpenAI el derecho de mostrar resúmenes de artículos seleccionados en ChatGPT y entrenar LLM con su contenido.
El desarrollador de IA ha firmado acuerdos de licencia similares con varias otras empresas de medios recientemente. En marzo, anunció acuerdos con Le Monde de Francia y Prisa Media con sede en Madrid, que publica varios populares periódicos en español. OpenAI había firmado previamente un acuerdo de contenido con Associated Press.
La empresa le dijo hoy a TechCrunch que hasta la fecha ha firmado alrededor de una docena de tales acuerdos de licencia. OpenAI también reveló que planea firmar “muchos más” en el futuro.
Al menos algunos de esos contratos, incluidos los que la empresa ha firmado con Associated Press y Axel Springer, no son exclusivos. Esto significa que los desarrolladores rivales de LLM tienen la oportunidad de firmar sus propios acuerdos de licencia de contenido. El hecho de que OpenAI ya utilice contenido de los editores en cuestión para entrenar sus modelos puede crear un incentivo particularmente fuerte para que los competidores sigan su ejemplo.
Google LLC también está realizando inversiones significativas para expandir la cantidad de texto disponible para sus modelos de lenguaje. A principios de este año, el gigante de búsqueda reveló un acuerdo con Reddit Inc. para licenciar contenido de la red social para su uso en proyectos de entrenamiento de IA. Se informa que el contrato vale más de $60 millones anuales.
En el caso de la asociación de OpenAI con el Financial Times, la licencia de contenido es solo un componente del acuerdo. Las empresas también colaborarán para desarrollar nuevas funciones de IA para los lectores del periódico. A fines del mes pasado, el Financial Times presentó una función de IA generativa que permite a los usuarios explorar su archivo utilizando solicitudes de lenguaje natural.