El Módulo LLM de M5Stack se convierte en la última incorporación a la gama de dispositivos que ofrecen capacidades de inteligencia artificial local sin necesidad de conexión a internet. Con su solución integral fuera de línea, este módulo de inferencia de Modelo de Lenguaje Grande (LLM) se perfila como perfecto para aplicaciones en el hogar inteligente, asistentes de voz y automatización industrial.
En el corazón del Módulo LLM encontramos el AX630C, un Sistema en Chip (SoC) que cuenta con 4GB de RAM LPDDR4 y 32GB de almacenamiento. Su Unidad de Procesamiento Neural (NPU) puede alcanzar rendimientos de 3.2 TOPS en modo INT8 y hasta 12.8 TOPS en INT4. M5Stack asegura que el chip principal opera con un consumo promedio de 1.5W, lo que permite un uso prolongado del dispositivo. También integra un micrófono, un altavoz, una ranura para tarjetas microSD y capacidades USB OTG, facilitando la conexión de periféricos como cámaras y depuradores.
La ranura microSD permite realizar actualizaciones de firmware tanto en caliente como en frío. El Módulo LLM se suma a una tendencia creciente de soluciones offline, junto a productos como SenseCAP Watcher y AI in a Box de Useful Sensors. Es compatible con varios controladores IoT, como CoreMP135, CoreS3 y Core2.
Entre sus especificaciones, destaca un procesador dual-core Arm Cortex-A53 que funciona a 1.2 GHz y un sistema de audio que incluye micrófono y altavoz de 8Ω con funcionalidades de audio inteligente, como Text-to-Speech (TTS) y Reconocimiento Automático de Voz (ASR). Además, incorpora una interfaz PHY RGMII/RMII de un solo canal y admite formatos comunes de codificación y decodificación de vídeo.
El precio del Módulo LLM se sitúa en 49.90 dólares (aproximadamente 46.50 euros) en la tienda online de M5Stack, aunque en el momento de esta redacción estaba agotado. También se ofrece un kit de depuración LLM, que amplía las capacidades del dispositivo al incluir un puerto Ethernet de 100 Mbps y un puerto de núcleo serial. Se anticipa compatibilidad futura con diversos modelos de lenguaje, como Qwen2.5 y Llama3.2, junto a modelos de visión por ordenador como CLIP y YoloWorld. Para quienes buscan profundizar en su uso, M5Stack proporciona recursos adicionales, incluyendo tutoriales y guías completas.