Después de la agitación con Deepseek, el lanzamiento de un nuevo modelo de inteligencia artificial (IA) en China acapara el protagonismo. El gigante Alibaba ha sacudido el panorama de la IA con Qwen, en su versión 2.5-Max. Según la multinacional fundada por Jack Ma, supera en rendimiento y capacidades a sus principales competidores. Se incluye a DeepSeek-V3, GPT de OpenAI, Claude de Anthropic y Llama de Meta Platforms.
“Qwen 2.5-Max supera … en casi todos los aspectos a GPT-4o, DeepSeek-V3 y Llama-3.1-405B”, afirmó la unidad de nube de Alibaba en su cuenta oficial de WeChat, destacando su rendimiento superior en múltiples pruebas de referencia. “Nuestros modelos base han demostrado ventajas significativas en la mayoría de los puntos de referencia y somos optimistas de que los avances en las técnicas posteriores al entrenamiento elevarán la próxima versión de Qwen2.5-Max a nuevas alturas”, asegura la multinacional china dueña de Aliexpress y Alipay.
Las acciones de Alibaba subían cerca del 3% durante la sesión europea, después de que el martes rebotasen más del 6%. La valoración en bolsa de la compañía china, que cotiza en Wall Street, supera los 230.000 millones de dólares. Pero queda todavía muy lejos de los niveles billonarios en que se mueven ahora Amazon o Alphabet.
Presentación de pruebas de Qwen
En su informe, Alibaba destaca que su nuevo modelo ha superado a DeepSeek-V3 en diversas pruebas, como Arena Hard, LiveBench, LiveCodeBench y GPQA-Diamond. “El éxito de DeepSeek ha sido un catalizador en la evolución de los modelos de IA en China. Pero con Qwen 2.5-Max estamos estableciendo un nuevo estándar en la industria”, afirmó un portavoz de la compañía citado por Reuters.
El ascenso de DeepSeek no solo ha generado preocupación entre sus rivales internacionales, sino que también ha provocado una respuesta agresiva en el mercado chino. Su modelo DeepSeek-V2, lanzado en mayo, desató una guerra de precios al ofrecer un acceso mucho más barato a sus capacidades de IA. Apenas 1 yuan (0,14 dólares) por cada millón de tokens procesados, según informa Reuters.
Esta estrategia obligó a Alibaba Cloud y otras grandes tecnológicas chinas, como Baidu y Tencent, a reducir drásticamente los costos de sus propios modelos. Con Qwen 2.5-Max, Alibaba no solo busca recuperar terreno en la carrera de la inteligencia artificial, sino consolidar su posición como líder global en el desarrollo de modelos avanzados.
La compañía ha apostado por una arquitectura MoE mejorada y una post-entrenamiento optimizado, asegurando que su modelo ofrece resultados superiores en tareas complejas de comprensión y generación de lenguaje natural. “La ampliación de los datos y del tamaño de los modelos no solo muestra avances en la inteligencia de los modelos, sino que también refleja nuestro compromiso inquebrantable con la investigación pionera”, declaró Alibaba en la presentación.
En líneas generales, en términos de misión y objetivo, Alibaba admite que tan solo se encuentran en una fase inicial de desarrollo al igual que sus competidores. “Nos dedicamos a mejorar las capacidades de pensamiento y razonamiento de los grandes modelos lingüísticos mediante la aplicación innovadora del aprendizaje por refuerzo a escala. Este esfuerzo promete permitir que nuestros modelos trasciendan la inteligencia humana, desbloqueando el potencial para explorar territorios inexplorados de conocimiento y comprensión”, apunta.