La Fundación OpenVoiceOS, que se ha convertido en un pilar fundamental en el ámbito de la tecnología de asistentes de voz de código abierto, tiene como objetivo ofrecer una alternativa enfocada en la privacidad a los asistentes de voz más populares que dominan el mercado, como los de Amazon, Google y Apple. Esta interesante iniciativa se originó en 2018, cuando Peter Steenbergen, conocido en el mundo tech como j1nx, se topó con un artículo que revisaba el hardware del asistente de voz Mycroft Mark II. Su implicación en el proyecto fue el germen que dio origen a MycroftOS, un sistema que posteriormente cambió su nombre a OpenVoiceOS – Mycroft Edition, utilizando Buildroot para soportar el hardware del Mark II.
La evolución de OpenVoiceOS no ha estado exenta de retos, enfrentándose a tensiones significativas dentro de la comunidad de código abierto que, en última instancia, condujeron al cierre de la empresa Mycroft en 2023. Tras este revés, OpenVoiceOS se hizo con la base de código de Mycroft A.I., incorporando las solicitudes de incorporación en espera provenientes de la comunidad. En colaboración con NEON A.I., asumieron el control de los foros de la comunidad de Mycroft A.I., que ahora operan en https://community.openconversational.ai/. En 2024, Peter y sus socios fundaron la Fundación OpenVoiceOS, que recientemente ha recibido reconocimiento oficial por parte del gobierno de los Países Bajos.
Componentes clave de OpenVoiceOS
OpenVoiceOS se estructura en varios componentes modulares. Entre estos se encuentran ovos-messagebus, que facilita la comunicación inter-módulos, ovos-core, el sistema central que gestiona todas las habilidades, y ovos-listener, que proporciona acceso al micrófono y realiza el reconocimiento de voz. Los usuarios tienen plena libertad para seleccionar los plugins de palabra de activación y de conversión de discurso a texto (STT) que prefieran, ya sean locales, en línea o en la nube. También hay un enfoque en la salida de sonido mediante ovos-audio, un nivel de abstracción de hardware con ovos-phal y интерфейс gráfico con ovos-gui, todos ellos evolucionando en medio de un contexto de disminución del soporte para marcos tradicionales.
La instalación de OpenVoiceOS es posible en cualquier sistema Linux, habiendo imágenes especiales para Raspberry Pi. Su desarrollo se complementa con HiveMind, un proyecto liderado por jarbas que permite gestionar módulos distribuidos entre dispositivos. Esto significa que tareas más intensivas en recursos pueden ser ejecutadas por servidores potentes, mientras que las tareas más ligeras se pueden llevar a cabo en dispositivos de recursos limitados. Este diseño arquitectónico permite implementar aplicaciones como asistentes de voz personalizados que se integran con Home Assistant.
La Fundación OpenVoiceOS se posiciona en una línea similar a la de la Open Home Foundation, subrayando la importancia de resguardar a la comunidad de desarrolladores y fomentar el crecimiento constante del marco ante las presiones comerciales. Entre sus colaboradores actuales se encuentran Visiolab y la Royal Visio Foundation, que están llevando a cabo pruebas de soluciones para usuarios ciegos y con discapacidad visual, así como el proyecto WASABI EU, que busca mejorar la eficiencia manufacturera a través de análisis aumentados.