Jingren Zhou, director de tecnología de Alibaba Cloud Intelligence, presenta los modelos Qwen 2.5 en la Conferencia Apsara de Alibaba Cloud en Hangzhou, septiembre de 2024. *Crédito: Alibaba Cloud*

Los grandes modelos de lenguaje producidos por empresas chinas de inteligencia artificial han recibido una oleada de respaldos inesperados últimamente.

Brian Chesky, director ejecutivo de Airbnb, causó revuelo el mes pasado cuando reveló que la compañía prefiere Qwen de Alibaba sobre ChatGPT para su chatbot de servicio al cliente, porque es «rápido y barato».

De los cinco modelos más populares en el foro de desarrolladores Hugging Face, cuatro son producidos por empresas chinas o se basan en modelos chinos.Fuente: Hugging Face

Antes de eso, Chamath Palihapitiya, un destacado capitalista de riesgo y ex ejecutivo de Facebook, dijo que había trasladado los flujos de trabajo de su empresa de Bedrock de Amazon al modelo Kimi K-2 de la startup Moonshot con sede en Beijing porque era «mucho más eficiente».

Ese mismo mes, Thinking Machines Lab, una startup de 12 mil millones de dólares dirigida por Mira Murati, ex directora de tecnología de OpenAI, lanzó una herramienta que ayuda a los usuarios a personalizar los modelos de código abierto existentes, incluidos ocho de Qwen.

Para muchos dentro de la industria de la IA, estas recomendaciones no han sido una sorpresa. Las empresas chinas han lanzado ofertas de LLM cada vez más competitivas desde que el lanzamiento de DeepSeek revolucionó la industria de la IA a principios de este año.

Para una startup promedio, lo que realmente importa es la velocidad y la calidad de los resultados, y si se trabaja a gran escala, lo económico que sea. Los modelos chinos que están saliendo al mercado han tenido un rendimiento consistentemente excelente al equilibrar estos tres factores.

Aman Sharma , cofundador de Lamatic, una empresa del sur de Florida que ayuda a las empresas a crear soluciones de inteligencia artificial.

“Estos ejemplos públicos son solo la punta del iceberg”, afirma Nathan Lambert , investigador de aprendizaje automático y autor del boletín Interconnects . “He oído hablar personalmente de muchos otros casos destacados, donde las startups estadounidenses de IA más valoradas y promocionadas están empezando a entrenar modelos con herramientas como Qwen, Kimi, GLM o DeepSeek”. GLM es un modelo desarrollado por la startup Zhipu , con sede en Pekín, que recientemente ha cambiado su nombre a Z.ai.

Además de acercarse a sus rivales estadounidenses en diversos parámetros de calidad, los modelos chinos también están conquistando clientes a medida que las preocupaciones geopolíticas y de ciberseguridad quedan relegadas a un segundo plano frente a factores como el coste, la eficiencia y la facilidad de uso. Este cambio representa, en parte, una ventaja para la tecnología de código abierto , que muchas empresas chinas de IA prefieren como forma de acelerar la innovación.

Pero algunos ven el creciente interés en los modelos chinos como un estímulo para la industria estadounidense de inteligencia artificial, así como una posible fuente de preocupación en Washington.

El gobierno estadounidense añadió a Zhipu a una lista negra comercial en enero, alegando sus vínculos con el ejército chino, algo que la compañía ha negado. Un informe reciente del Centro de Estándares e Innovación en IA, perteneciente al Departamento de Comercio, advirtió sobre los posibles riesgos de seguridad asociados con los sistemas de IA extranjeros y que el creciente uso de modelos chinos está «reduciendo el liderazgo global histórico de los desarrolladores estadounidenses».

*Fuente: Hugging Face a través del Centro de Estándares e Innovación en IA*

“Si los desarrolladores de modelos estadounidenses están perdiendo clientes potenciales de grandes empresas tecnológicas como Airbnb ante competidores chinos, es una señal de alerta de que su enfoque no está funcionando bien”, afirma Sam Bresnick , investigador del Centro de Seguridad y Tecnología Emergente (CSET) de la Universidad de Georgetown. Bresnick añade que en Estados Unidos se está generando un impulso para limitar el uso de los LLM chinos en el gobierno, lo que podría extenderse a las empresas en algún momento.

Mientras tanto, plataformas como DeepSeek y Qwen han sido tendencia en OpenRouter , una popular plataforma estadounidense que dirige a los desarrolladores a diferentes modelos de IA. Ambas estuvieron entre los diez modelos más populares de la plataforma la semana pasada, junto con las de Z.ai y MiniMax, un unicornio de IA con sede en Shanghái. El año pasado, por estas fechas, la lista estaba dominada por modelos estadounidenses.

El factor más importante donde esto importa es en aplicaciones gubernamentales y empresariales de alto riesgo, donde la seguridad es primordial. Existe una preocupación natural sobre con qué datos se entrenó el modelo antes y después, y si presenta comportamientos indeseables para la empresa.

Nathan Benaich , fundador de la firma de capital de riesgo Air Street Capital

Una razón para la creciente adopción de los modelos chinos es que muchos de ellos son lo que técnicamente se conoce como «peso abierto». Las empresas estadounidenses tienden a proteger rigurosamente los datos de entrenamiento, el código y la arquitectura de sus modelos, y restringen su uso y distribución. Sin embargo, los modelos chinos suelen contar con licencias más permisivas, que permiten a los usuarios modificar los parámetros —también conocidos como pesos— que definen la estructura interna de un modelo y afectan su toma de decisiones.

En diciembre de 2023, Alibaba Cloud anunció que las versiones de 72 mil millones y 1800 millones de parámetros de su modelo Tongyi Qianwen (Qwen) serían de código abierto.Crédito: Alizila

«Si eres una startup, básicamente puedes sacar esos pesos de Internet y usar tus datos propietarios para ajustarlos», dice Bresnick, describiendo un proceso mediante el cual las empresas pueden entrenar un modelo existente para tareas específicas, como codificar o responder consultas de clientes.

Con escasez de recursos, muchas startups están haciendo precisamente eso. Por ejemplo, Univa, una empresa surcoreana que desarrolla soluciones de IA para procesar documentos para departamentos gubernamentales, afirmó en septiembre que el software de código abierto de Qwen le había ayudado a reducir costos en un 30 %.

La propia Alibaba calcula que existen más de 170.000 modelos basados en Qwen. La empresa china lidera a nivel mundial la cantidad de nuevos modelos derivados que se suben mensualmente al foro de desarrolladores estadounidense Hugging Face, superando a Llama de Meta desde principios de este año.

El número real de empresas que utilizan modelos chinos puede ser incluso mayor.

La semana pasada, Cursor, una startup con sede en San Francisco, impresionó a los usuarios con una nueva herramienta de IA que puede escribir código mucho más rápido que sus competidores. Sin embargo, su tendencia a cambiar a caracteres chinos y otras características técnicas han generado especulaciones generalizadas en la industria sobre su origen chino. Una conjetura similar se refiere a SWE-1.5 , un agente de codificación lanzado la semana pasada por otra startup de Silicon Valley, Cognition. Algunos usuarios lo han vinculado con GLM-4.5 de Zhipu, un modelo diseñado para la programación.

Una demostración del modelo de codificación de frontera de Cursor. Crédito: Cursor

Zhipu se negó a comentar sobre las especulaciones. Sin embargo, Li Zixuan, director de operaciones globales de Zhipu, declaró a The Wire China que la compañía está «sIguiendo un número creciente de modelos derivados y perfeccionados en laboratorios de investigación y startups».

Tanto Cursor como Cognition no respondieron a las solicitudes de comentarios.

Otro factor que favorece a la IA china es el precio. Para los usuarios, los LLM chinos suelen costar alrededor de una quinta parte que sus homólogos extranjeros, según un nuevo informe de SuperCLUE, un grupo chino que clasifica las capacidades de los LLM. MiniMax, por ejemplo, anuncia su último modelo, el M2, como una alternativa económica al Claude Sonnet 4.5 de Anthropic. Si bien ambos obtienen puntuaciones similares en varias pruebas de referencia, el M2 cuesta un 8 % menos que este último, como destaca la compañía en sus publicaciones en redes sociales.

*Nota: El Índice de Inteligencia de Análisis Artificial ¹ es una métrica combinada que abarca múltiples dimensiones de la inteligencia. Fuente: Análisis Artificial*

“Existe una enorme demanda mundial de IA en este momento, y vemos grandes oportunidades para las empresas que realmente puedan innovar”, dijo un portavoz de MiniMax a The Wire China en un correo electrónico.

El dominio a largo plazo de la IA estadounidense depende en gran medida de una trayectoria impredecible de la tecnología si continuamos cediendo el liderazgo en código abierto a China.

Nathan Lambert , investigador de aprendizaje automático y autor del boletín Interconnects

Algunos analistas afirman que las empresas chinas buscan deliberadamente vender a precios más bajos que sus rivales estadounidenses e internacionales. Sin embargo, los bajos precios también reflejan la realidad del mercado local. «Los modelos chinos intentan globalizarse, pero siguen atendiendo principalmente a clientes chinos, y nadie va a pagar los precios de OpenAI», afirma Rui Ma , fundador de la firma de investigación Tech Buzz China.

*Precios de OpenAI vs. DeepSeek. Fuente: OpenAI , DeepSeek*

“Para una startup promedio, lo que realmente importa es la velocidad y la calidad de los resultados, y si se trabaja a gran escala, lo económico que sea”, afirma Aman Sharma , cofundador de Lamatic, una empresa del sur de Florida que ayuda a las empresas a desarrollar soluciones de IA. “Los modelos chinos que están saliendo al mercado han tenido un rendimiento consistentemente excelente en cuanto al equilibrio entre estos tres factores”.

En ciertos sectores, el uso de modelos chinos, incluidos productos basados en ellos, sigue siendo un rotundo desconocimiento. «El factor más importante donde esto importa es en aplicaciones gubernamentales y empresariales de alto riesgo, donde la seguridad es primordial», afirma Nathan Benaich , fundador de Air Street Capital, una firma de capital riesgo con sede en Londres especializada en empresas de IA.

Algunos investigadores también han identificado sesgos políticos y censura en los modelos chinos. «Existe una preocupación natural sobre los datos con los que se entrenó el modelo antes y después del entrenamiento, y si presenta comportamientos que la empresa no desearía», añade Benaich.

Sin embargo, existe un interés considerable en las ofertas chinas. Una encuesta realizada en julio por Artificial Analysis, empresa con sede en San Francisco que desarrolla benchmarks de IA, reveló que hasta el 82 % de los usuarios están dispuestos a usar LLM chinos, siempre que estén alojados en una infraestructura ubicada fuera del país.

Las empresas chinas de IA aún están lejos de alcanzar a OpenAI en cuanto a ingresos o valoración de mercado. Sin embargo, algunos observadores afirman que su creciente popularidad indica que los laboratorios y empresas de IA en EE. UU. deberían replantearse su estrategia, especialmente su obsesión con los modelos propietarios.

“El dominio a largo plazo de la IA estadounidense depende en gran medida de una trayectoria impredecible de la tecnología, si continuamos cediendo el liderazgo en código abierto a China”, dice Lambert, quien ha iniciado una campaña para abogar por más recursos para modelos de código abierto locales.

RELACIONADAS NUVE

Tras el ascenso de DeepSeek, más empresas chinas están resaltando sus raíces

Estas son las mayores redes sociales chinas

CHINA CASAS BARATAS AMUEBLADAS, para entrar a vivir sin ningún desembolso inicial

En España el principal fabricante de baterías para vehículos eléctricos del mundo

The Wire China

Relacionado

Los modelos de IA chinos, baratos y de código abierto, están despegando

The Wire China

Algunas de las empresas emergentes más prometedoras de Silicon Valley están recurriendo a empresas como Qwen de Alibaba para encontrar un atajo

The Wire China

Relacionado

Los modelos de IA chinos, baratos y de código abierto, están despegando

Relacionado

Ser coherente con el feminismo solo refuerza la razón y verdad de sus postulados

Sanitarios de La Paz dicen basta ante la falta de camas y de personal