Xiaomi ha anunciado recientemente una reducción permanente en los precios de sus APIs de la serie MiMo-V2.5. Estas reducciones representan un cambio significativo respecto al precio original de las API, alcanzando rebajas de hasta el 99%. Xiaomi ha simplificado también el modelo de precios, eliminando las diferencias entre las longitudes de la ventana de contexto. Los nuevos precios entraron en vigor a nivel mundial a medianoche del 27 de mayo, hora de Pekín.
La última caída de precios afecta tanto a las versiones MiMo-V2.5 como MiMo-V2.5 Pro. Específicamente, el costo por caché de entrada de la MiMo-V2.5 Pro se ha reducido a 0,025 yuanes por millón de tokens (aproximadamente 0,003 euros), lo que representa una reducción del 99%. Por otro lado, el precio para la MiMo-V2.5 ha bajado a 0,02 yuanes por millón de tokens (unos 0,0025 euros), logrando una reducción del 98%. En cuanto a los precios de salida, la MiMo-V2.5 Pro ahora cuesta 6 yuanes por millón de tokens (alrededor de 0,77 euros), mientras que la MiMo-V2.5 tiene un precio de 2 yuanes por millón de tokens (aproximadamente 0,26 euros), alcanzando reducciones máximas del 86% y 93%, respectivamente.

Además de las atractivas reducciones en los precios de las API, Xiaomi ha perfeccionado significativamente su sistema de facturación del Token Plan. El renovado Token Plan ofrece un uso incrementado, entre 5 y 8 veces más, sin costo adicional e introduce el concepto de Créditos para unas reglas de facturación más claras y comprensibles. Esta renovación se atribuye a las continuas mejoras de Xiaomi en su sistema de inferencia, llevadas a cabo por su equipo técnico.
Avances técnicos impulsados por Xiaomi
Detrás de estos avances se encuentra la completa integración de la tecnología SWA (Sliding Window Attention) a través de su sistema SGLang HiCache. Esta mejora ha reducido la carga de transferencia de datos entre sistemas de almacenamiento de múltiples niveles, incluidos GPU, CPU y SSD, a aproximadamente una séptima parte de los niveles anteriores. Al mismo tiempo, la cantidad de tokens cacheables ha aumentado casi cinco veces, resultando en mejoras notables en las tasas de aciertos de caché y la eficiencia de inferencia. Optimización adicional, como el paralelismo experto mejorado y las estrategias de longitud de entrada en cubos, han fortalecido aún más la capacidad de procesamiento de entrada en entornos de clúster, todo mientras se reduce el costo por token sin comprometer la calidad del servicio.
¿Quieres montarte tu propio sistema Smart Home?
¿Te gustaría empezar poco a poco teniendo Google Home, Alexa o Home Assistant para controlar las luces, calefacción y otros electrodomésticos de la casa? ¡Te ayudamos!
Entra en nuestro Grupo de Telégram de Domótica y también puedes entrar a nuestro Foro de Domótica donde podrás empezar a leer y preguntar tus dudas. Además, si quieres estar al tanto de las ofertas de domótica que salen a diario para poder hacerte un sistema de domótica low cost, entra a nuestro Canal de ofertas de domótica y no te perderás ni una o si lo prefieres y no tienes Telegram, puedes entrar a nuestra página de ofertas de domótica o Smart Home en Facebook. ¡Síguenos también en nuestro Facebook, Twitter o Instagram!
¡Te esperamos!Si también buscas otro tipo de ofertas, puedes echar un ojo a nuestros otros canales:
* Tecnología en general *
* Juguetes / consolas / Juegos de mesa *
* Manualidades *
Si no tienes Telegram puedes consultar todas las ofertas en Megabazar.es
Si también buscas otro tipo de ofertas, puedes echar un ojo a nuestros otros canales:
* Tecnología en general *
* Juguetes / consolas / Juegos de mesa *
* Manualidades *
Si no tienes Telegram puedes consultar todas las ofertas en Megabazar.es
* Tecnología en general * * Juguetes / consolas / Juegos de mesa * * Manualidades *
Descubre más desde Domótica en Casa
Suscríbete y recibe las últimas entradas en tu correo electrónico.