Moonshot AI ha lanzado Kimi K2, un nuevo modelo de lenguaje grande (LLM) disponible bajo una licencia MIT modificada y sin coste alguno. Kimi K2 ha logrado posicionarse rápidamente entre los diez mejores modelos de inteligencia artificial a nivel mundial en el ranking LMSys text arena, superando a DeepSeek, un modelo gratuito que hasta finales de 2024 destacó por su capacidad y apertura en el código. Este avance sitúa a Kimi K2 como un referente en el ámbito de los modelos de lenguaje abiertos y de alto rendimiento.
Kimi K2 utiliza una arquitectura de mezcla de expertos (MoE) con un billón de parámetros, distribuidos entre 384 expertos, y cuenta con una ventana de contexto de 128.000 tokens. Durante la inferencia activa solo un subconjunto de 32.000 millones de parámetros. Está diseñado principalmente para agentes de IA que requieren resolver problemas de forma autónoma, razonamiento avanzado e integración con herramientas externas. Estas características permiten que Kimi K2 aborde tareas complejas y apoye investigaciones relacionadas con retos empresariales sofisticados.
Kimi K2: diseño y entrenamiento
El entrenamiento de Kimi K2 combinó datos del mundo real con entornos simulados para solucionar la escasez de casos de uso de herramientas en los conjuntos de datos existentes. Un elemento clave es su mecanismo de autoevaluación, que capacita al modelo para juzgar la calidad de sus propias ejecuciones durante el entrenamiento. Para superar problemas de estabilidad con el optimizador Muon, los desarrolladores crearon MuonClip, un optimizador que permitió preentrenar el modelo con 15,5 billones de tokens de forma eficiente y estable.
El despliegue de Kimi K2 exige una infraestructura de gran nivel: se requieren al menos 1 TB de almacenamiento y un clúster compuesto por un mínimo de 16 GPUs Nvidia H20 o H200. El modelo está alojado en Hugging Face y puede descargarse gratuitamente. Para usuarios sin acceso a esta infraestructura, las versiones destiladas de DeepSeek son una alternativa práctica, ya que pueden funcionar con GPUs Nvidia de 12 GB o más, hardware común en sistemas de consumo.
Acceso y usos del modelo
Para quienes quieran interactuar con Kimi K2, hay disponible una interfaz de chatbot gratuita. Los desarrolladores de software pueden solicitar acceso vía API, que se ofrece bajo un modelo de pago. Esta configuración busca cubrir diversas necesidades, desde el uso experimental casual hasta integraciones empresariales complejas. Kimi K2 abre así una puerta a aplicaciones avanzadas que requieren modelos potentes y adaptables, manteniendo la accesibilidad del software libre para la comunidad.