GLM-Image nuevo modelo open source de IA multimodal lanzado conjuntamente por Huawei y Zhipu rival de Nano Banana Pro

Inteligencia Artificial

GLM-Image, el nuevo modelo de generación de imágenes desarrollado conjuntamente por Zhipu Technology y Huawei, arranca una nueva era en la inteligencia artificial de imagen en China. Este modelo de última generación se apoya en la plataforma de hardware Huawei Ascend Atlas 800T A2 y en el framework de IA MindSpore de Huawei, completando un proceso integral que va desde el preprocesamiento de datos hasta el entrenamiento a gran escala. GLM-Image se convierte así en el primer modelo multimodal de referencia que logra un entrenamiento end-to-end sobre chips nacionales, marcando un hito en la autonomía tecnológica y la innovación en IA.

La arquitectura híbrida “auto-regresiva + decodificador de difusión” que emplea GLM-Image representa un avance capital en la integración entre generación de imágenes y modelos de lenguaje. Esta combinación asegura una comprensión profunda de instrucciones globales, a la vez que mejora la expresión de detalles locales con gran precisión. Este diseño es especialmente efectivo en escenarios que requieren conocimientos complejos y detallados, como el diseño de carteles, creación de presentaciones y dibujos educativos. Por otra parte, el modelo impulsa el desarrollo hacia la “generación cognitiva”, explorando nuevas vías de generación con capacidad de razonamiento, ejemplificadas por proyectos como Nano Banana Pro.

GLM-Image: rendimiento y capacidades técnicas

En cuanto a rendimiento, GLM-Image ha alcanzado el primer puesto en benchmarks públicos como CVTG-2K, especializado en generación de texto visual en chino, y LongText-Bench, centrado en renderizado de textos extensos. Su desempeño en tareas de generación de caracteres chinos es sobresaliente. La innovación también llega al tokenizer, que ahora permite una entrada multi-resolución adaptable de forma nativa, capaz de trabajar con imágenes que van desde 1024×1024 hasta 2048×2048 píxeles sin necesidad de reentrenamiento adicional. Este avance garantiza flexibilidad y calidad en la generación gráfica para formatos muy diversos.

GLM-Image cubre una variedad amplia de aplicaciones prácticas. En ilustración científica puede reproducir complejos flujos lógicos con sus explicaciones textuales de manera fiable. En ecommerce y creación de cómics mantiene coherencia estilística y precisión en el texto integrado. Para las portadas de redes sociales, ofrece soporte para composiciones complejas con fusión avanzada de elementos. En carteles comerciales, consigue composiciones visuales con sentido del diseño y textos perfectamente incrustados. Además, su capacidad en fotografía realista abarca retratos, mascotas, paisajes y bodegones, mostrando una versatilidad notable en diferentes tipos de imágenes.

Costes, eficiencia y disponibilidad de GLM-Image

El costo de usar la API de GLM-Image es competitivo, situándose en 0,1 yuanes chinos por imagen (aproximadamente 0,013 euros). La compañía ya trabaja en versiones optimizadas para mejorar velocidad de generación y relación calidad-precio. Las herramientas, demos y recursos open source están accesibles a través de la plataforma oficial de Zhipu, facilitando la experimentación y el desarrollo para investigadores y profesionales de IA interesados en aprovechar esta tecnología puntera.

El lanzamiento de GLM-Image simboliza un importante avance en los entrenamientos de modelos multimodales de alto nivel respaldados por chips nacionales y marcos de IA propios. Este progreso refleja la evolución constante de la infraestructura tecnológica china en inteligencia artificial, reforzando la independencia tecnológica y elevando el nivel de innovación local en modelos generativos multicampo.

Fuente

¿Quieres montarte tu propio sistema Smart Home?

¿Te gustaría empezar poco a poco teniendo Google Home, Alexa o Home Assistant para controlar las luces, calefacción y otros electrodomésticos de la casa? ¡Te ayudamos! Entra en nuestro Grupo de Telégram de Domótica y también puedes entrar a nuestro Foro de Domótica donde podrás empezar a leer y preguntar tus dudas. Además, si quieres estar al tanto de las ofertas de domótica que salen a diario para poder hacerte un sistema de domótica low cost, entra a nuestro Canal de ofertas de domótica y no te perderás ni una o si lo prefieres y no tienes Telegram, puedes entrar a nuestra página de ofertas de domótica o Smart Home en Facebook. ¡Síguenos también en nuestro Facebook, Twitter o Instagram! ¡Te esperamos!

Si también buscas otro tipo de ofertas, puedes echar un ojo a nuestros otros canales:
* Tecnología en general *
* Juguetes / consolas / Juegos de mesa *
* Manualidades *
Si no tienes Telegram puedes consultar todas las ofertas en Megabazar.es


Descubre más desde Domótica en Casa

Suscríbete y recibe las últimas entradas en tu correo electrónico.

Contestar

Tu e-mail no será publicadoRequired fields are marked *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

*


Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

Lost Password

Registro

Descubre más desde Domótica en Casa

Suscríbete ahora para seguir leyendo y obtener acceso al archivo completo.

Seguir leyendo

Domótica en Casa
Resumen de privacidad

Esta web utiliza cookies para que podamos ofrecerte la mejor experiencia de usuario posible. La información de las cookies se almacena en tu navegador y realiza funciones tales como reconocerte cuando vuelves a nuestra web o ayudar a nuestro equipo a comprender qué secciones de la web encuentras más interesantes y útiles.