El desarrollador de voz sintética Play.ht ha presentado un nuevo modelo de clonación de voz llamado Parrot, capaz de crear una voz deepfake a partir de una grabación de segundos de su discurso. Parrot está disponible en versión beta para la plataforma de síntesis de texto a voz de Play.ht, dirigida a los creadores de contenidos que buscan soluciones de clonación de voz. Parrot Deepfake Play.ht aca...
Microsoft invertirá varios miles de millones de dólares en OpenAI para profundizar en su asociación con la startup de IA generativa, aunque no ha dado una cantidad exacta en dólares. La nueva financiación llega tras la explosión de interés y adopción del modelo GPT-3 de OpenAI, el creador de texto a imagen DALL-E y, especialmente, su interfaz de IA conversacional, ChatGPT. OpenAI dijo que utilizar...
La start-up de inteligencia artificial (AI) para restaurantes, ConverseNow, ha comenzado a responder el teléfono en todas las ubicaciones de Anthony’s Coal Fired Pizza & Wings propiedad de la empresa. Las 60 ubicaciones de Anthony’s que no son franquiciadas por la empresa matriz BurgerFi han integrado ConverseNow en su sistema telefónico para tomar el pedido de un cliente y luego u...
Sony ha presentado un nuevo asistente de voz para la atención al cliente en la India en colaboración con la empresa de IA conversacional Yellow.ai. La nueva IA ‘Isha’ es un agente virtual multilingüe capaz de manejar conversaciones en inglés, hindi y bengalí y responder a las preguntas de los clientes o conectarlos con agentes humanos según sea necesario. Isha AI Los servicios de chat ...
SoundHound ha presentado una nueva herramienta empresarial de IA de voz para la recopilación y el análisis de conversaciones en tiempo real, denominada Transcripción Inteligente. El nuevo servicio combina el procesamiento de voz a texto con la comprensión del lenguaje natural para anotar y marcar diferentes temas y oradores mientras siguen hablando. Inteligencia Artificial Intelligent Transcriptio...
Google ha presentado un motor de IA de texto a vídeo llamado Imagen Video en un documento de investigación. La herramienta de medios sintéticos traduce las instrucciones escritas en vídeos silenciosos pocos días después de que Meta presentara su propia IA de texto a vídeo, Make-A-Video. Los vídeos de Imagen, como el ejemplo anterior, utilizan la IA para interpretar las palabras de un mensaje, tant...
Nvidia ha presentado un nuevo sistema de información en el coche con pantallas y entretenimiento para los pasajeros individuales, así como para los conductores. El sistema Drive Concierge se vincula a la pila de software Drive IX de Nvidia y al motor Omniverse Avatar Cloud Engine, lo que permite a los desarrolladores desplegar sus propios asistentes de IA y será compatible con plataformas de IA pa...
El fabricante de juguetes robóticos Robosen ha presentado un nuevo juguete de Buzz Lightyear basado en la reciente película de Disney y Pixar, construido con IA conversacional y reconocimiento de voz para interactuar con los niños. El robot incorpora la comprensión del lenguaje natural para detectar cuando se le dirige la palabra y responder como el personaje de la película, aunque la IA hace que ...
Nuance ha añadido nuevas funciones de IA por voz para los clientes británicos de Virgin Media O2. Los televisores Virgin que utilizan la plataforma Dragon TV pueden ahora cambiar de canal y buscar en las guías de programación mediante comandos de voz. Las herramientas de voz adicionales están disponibles para cualquier persona que tenga el televisor adecuado, pero están específicamente destinadas ...
OpenAI ha enseñado a su motor de conversión de texto en imagen DALL-E un nuevo truco que permite a la IA visualizar lo que podría haber más allá del marco del arte clásico y original. La nueva función Outpainting procesa una obra de arte existente y extrapola lo que podría haber si el marco fuera más grande. Por ejemplo, “La joven con el pendiente de perla” de Johannes Vermeer se encue...
A principios de este año, Google Research presentó su trabajo sobre RawNeRF con “NeRF in the Dark: High Dynamic Range View Synthesis from Noisy Raw Images” en la conferencia CVPR (Computer Vision and Pattern Recognition) 2022. Un campo de radiancia neural (o NeRF) es una red neural que puede tomar imágenes 2D y crear una escena 3D. Google ha creado una llamada RawNeRF para escenas oscu...