Meta presentó su último modelo de lenguaje de código abierto, Llama 3.1, el 23 de julio. Esta nueva versión incluye varias mejoras, como capacidades de inferencia mejoradas, un soporte multilingüe ampliado y un aumento en la longitud del contexto hasta 128,000 tokens.
El punto culminante de este lanzamiento es el modelo insignia, Llama 3.1-405B, que cuenta con 405 mil millones de parámetros. Según Meta, este modelo compite eficazmente con los principales modelos de código cerrado en áreas como el razonamiento de sentido común, la toma de decisiones, las matemáticas, el uso de herramientas y la traducción multilingüe. Meta afirma que su rendimiento es comparable al de otros modelos avanzados como GPT-4, GPT-4o y Claude 3.5 Sonnet.
Las mejoras no se limitan al modelo de gama alta. Las versiones de 8 mil millones y 70 mil millones de parámetros de Llama 3.1 también se promocionan como altamente competitivas tanto con modelos de código abierto como de código cerrado de tamaños similares.
Para aquellos interesados en probar el modelo, Llama 3.1 está disponible para su descarga desde el sitio web oficial de Meta y Hugging Face. Además, más de 25 socios importantes, incluidos proveedores de servicios en la nube como AWS, Azure y Google Cloud, así como fabricantes de hardware como Nvidia y Dell, han confirmado su apoyo al nuevo modelo.
Así que, ya sea que seas un desarrollador, un investigador o una empresa que busque aprovechar modelos de lenguaje avanzados, Llama 3.1 parece ser un fuerte candidato para una variedad de aplicaciones sofisticadas.