DeepSeek ha lanzado oficialmente su última versión, DeepSeek-V4, que supone un avance notable tanto en especificaciones técnicas como en estrategia de despliegue. Según un anuncio difundido por el canal oficial de DeepSeek en WeChat, este nuevo modelo es capaz de manejar una longitud de contexto que supera el millón de caracteres, situándose así a la vanguardia en desarrollos nacionales y de código abierto en capacidades de agentes, conocimiento global y rendimiento en razonamiento. Esta mejora refleja el compromiso de DeepSeek por seguir ampliando los límites en procesamiento y comprensión en modelos de lenguaje de gran escala.
El acceso a la API actualizada se realiza mediante la selección del parámetro model_name, que admite las variantes deepseek-v4-pro o deepseek-v4-flash, lo que subraya la búsqueda constante de la plataforma por ofrecer servicios eficientes y flexibles. Aunque DeepSeek-V4 escala hasta un total de un billón de parámetros, solo se activan alrededor de 37.000 millones de parámetros por token en el proceso de inferencia. Esta activación selectiva mantiene los costes de inferencia al nivel de su predecesor, DeepSeek-V3, optimizando así el equilibrio entre demanda computacional y rendimiento sin sacrificar la capacidad del modelo.
DeepSeek y su nueva arquitectura de hardware
El despliegue de DeepSeek-V4 sobre los últimos chips Ascend (昇腾) de Huawei representa un cambio significativo en la estrategia de hardware. Los equipos de ingeniería han llevado a cabo un profundo trabajo de adaptación, que ha incluido la reescritura de partes críticas del núcleo del código y la migración desde el ecosistema CUDA de Nvidia hacia la arquitectura de cómputo CANN (Compute Architecture for Neural Networks) de Huawei. Esta transición no solo ha supuesto un gran esfuerzo técnico, sino que marca un giro estratégico hacia la priorización del acceso exclusivo temprano para fabricantes de chips nacionales, en detrimento del soporte previo para hardware de Nvidia o AMD.
Este acercamiento responde a una tendencia creciente dentro del sector de IA y semiconductores en China, donde fortalecer la integración nativa entre software y hardware cobra una importancia decisiva. Con la alineación de DeepSeek-V4 a la plataforma propietaria de Huawei, los desarrolladores refuerzan el compromiso por potenciar las capacidades nacionales para el despliegue y optimización de modelos de IA a gran escala, contribuyendo al desarrollo independiente y competitivo del ecosistema tecnológico local.