Pangu Ultra de Huawei: un análisis asombroso de su rendimiento frente a DeepSeek-R1 sin NVIDIA

Inteligencia Artificial

Huawei ha hecho un gran avance con su modelo Pangu Ultra, que demuestra un potencial competitivo en capacidad de inferencia, rivalizando con el DeepSeek-R1. Este modelo, que cuenta con 135 mil millones de parámetros, ha sido entrenado completamente en clústeres Ascend, prescindiendo de la tecnología de Nvidia. Lo notable es que durante todo el proceso de entrenamiento no se han presentado picos de pérdida. Gracias a las mejoras en la arquitectura del modelo y estrategias de optimización del sistema, la tasa de utilización de la potencia de cálculo de Pangu Ultra ha superado el 52%.

Durante la fase de pre-entrenamiento, Pangu Ultra no solo obtuvo los mejores resultados en numerosos benchmarks en inglés, sino que también destacó en todas las tareas en chino, superando a modelos de referencia como Llama 405B y DeepSeek-V3. En particular, el modelo ha brillado en conjuntos de datos desafiantes como MMLU, TriviaQA y GSM8K, donde ha demostrado una sobresaliente comprensión del lenguaje y capacidad de razonamiento.

El diseño de Pangu Ultra se basa en una estructura de red profunda con 94 capas, incluyendo de forma innovadora un mecanismo de atención de consulta agrupada (GQA). Junto a esto, se han implementado la normalización Sandwich-Norm y la estrategia de inicialización de parámetros TinyInit, logrando así una estabilidad y velocidad de convergencia notables. A diferencia de la normalización Pre-LN tradicional, Sandwich-Norm normaliza las salidas de las subcapas mientras reduce la inestabilidad en el entrenamiento, y TinyInit optimiza el rendimiento en la inicialización teniendo en cuenta tanto la profundidad como el ancho del modelo.

El proceso de entrenamiento de Pangu Ultra se ha dividido en tres fases: pre-entrenamiento, extensión de contexto largo y ajuste de instrucciones. La fase de pre-entrenamiento se ha subdividido en etapas generales, de inferencia y de enfriamiento, con el fin de mejorar integralmente la comprensión del lenguaje y la capacidad de razonamiento del modelo. Además, el equipo de investigación ha optimizado el tokenizer, asegurando una cobertura y eficiencia de codificación de datos en diversos dominios.

Pangu Ultra ha sido entrenado en un clúster de computación masiva compuesto por 8192 procesadores AI Ascend. En su entrenamiento, se han utilizado diversas estrategias de paralelización que garantizan tanto la eficiencia computacional como un alto nivel de transferencia de datos. Estas innovaciones y estrategias de optimización permiten que Pangu Ultra compita al más alto nivel con otros modelos poderosos del sector.

Fuente

¿Quieres montarte tu propio sistema Smart Home?

¿Te gustaría empezar poco a poco teniendo Google Home, Alexa o Home Assistant para controlar las luces, calefacción y otros electrodomésticos de la casa? ¡Te ayudamos! Entra en nuestro Grupo de Telégram de Domótica y también puedes entrar a nuestro Foro de Domótica donde podrás empezar a leer y preguntar tus dudas. Además, si quieres estar al tanto de las ofertas de domótica que salen a diario para poder hacerte un sistema de domótica low cost, entra a nuestro Canal de ofertas de domótica y no te perderás ni una o si lo prefieres y no tienes Telegram, puedes entrar a nuestra página de ofertas de domótica o Smart Home en Facebook. ¡Síguenos también en nuestro Facebook, Twitter o Instagram! ¡Te esperamos!

Si también buscas otro tipo de ofertas, puedes echar un ojo a nuestros otros canales:
* Tecnología en general *
* Juguetes / consolas / Juegos de mesa *
* Manualidades *
Si no tienes Telegram puedes consultar todas las ofertas en Megabazar.es


Descubre más desde Domótica en Casa

Suscríbete y recibe las últimas entradas en tu correo electrónico.

Contestar

Tu e-mail no será publicadoRequired fields are marked *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

*

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

Lost Password

Registro

Descubre más desde Domótica en Casa

Suscríbete ahora para seguir leyendo y obtener acceso al archivo completo.

Seguir leyendo

Domótica en Casa
Resumen de privacidad

Esta web utiliza cookies para que podamos ofrecerte la mejor experiencia de usuario posible. La información de las cookies se almacena en tu navegador y realiza funciones tales como reconocerte cuando vuelves a nuestra web o ayudar a nuestro equipo a comprender qué secciones de la web encuentras más interesantes y útiles.