Умные дисплеи Amazon Echo Show оказались завалены рекламой
Владельцы Amazon Echo Show сообщают о росте количества рекламы на умных дисплеях. Кроме того, устройства теперь могут воспроизводить аудиорекламу, когда пользователи пользуются сервисом Amazon Music.
Новый релиз публичного детектора голоса Silero VAD v6
Историческое сравнение версийНа Хабре уже было аж 3 статьи про развитие нашего публичного детектора голоса Silero VAD (последняя тут). А вот что стало лучше в этот раз:Все прошлые фишки и
Elevenlabs представил 11ai — голосового помощника с MCP для интеграции в инструменты цифрового документооборота
Компания ElevenLabs представляет новый продукт — 11ai, который представляет собой голосового ИИ-помощника, предназначенного для активного участия в цифровых рабочих процессах. Альфа-версия предназначена для демонстрации возможностей технологии, ориентированной на голос, и интеграции с API.
Бывшие инженеры Google запустили голосового AI-компаньона Huxe
Новая разработка создателей NotebookLM — голосовой помощник Huxe — превращает повседневные дела, почту и интересы в интерактивные подкасты с возможностью диалога.
«Я слышу свой код»: как работает Java-программист, потерявший зрение
Константин Евтеев @beginner760собирает Java-код с помощью диктора NVDA, редактирует его в Блокноте и передает на Linux по SSH через самописные bash-скрипты.Константин Евтеев
Российский электрокар «Атом» получит голосового помощника с ИИ
Российский электрокар «Атом» получит нового голосового помощника. Помощник будет работать на базе искусственного интеллекта. Ассистент сможет вести живой диалог и управлять функциями машины. Работать помощник будет даже без интернета.С помощью голосового помощника водитель сможет управлять климат‑контролем, освещением, дверями и окнами. Можно будет настраивать руль, зеркала и сиденья. Ассистент будет работать с экраном дополненной реальности и планшетом на руле. Он сможет анализировать состояние автомобиля и давать советы.
Платформа голосового AI Phonic получает поддержку от Lux
Качество голосов, сгенерированных AI, достаточно хорошее для таких вещей, как создание аудиокниг и подкастов, чтение статей вслух и базовая поддержка клиентов. Но многие компании не считают, что голосовая технология AI достаточно надежна для развертывания.
Улучшения в голосовом режиме ChatGPT: меньше прерываний, больше человечности
В понедельник компания OpenAI выпустила обновления для расширенного голосового режима — функции искусственного интеллекта, которая позволяет общаться с ChatGPT в режиме реального времени, — чтобы сделать ИИ-помощника более человечным и реже прерывать пользователей.
Sesame, стартап, создавший вирусного виртуального помощника Maya, выпускает свою базовую модель AI
Компания Sesame, занимающаяся разработкой искусственного интеллекта, выпустила базовую модель, на которой основан Maya — впечатляюще реалистичный голосовой помощник. Модель, размер которой составляет 1 миллиард параметров, находится под лицензией Apache 2.0, что означает, что ее можно использовать в коммерческих целях с небольшими ограничениями. Названная CSM-1B, модель генерирует «аудиокоды RVQ» из текстовых и аудиовходов, согласно описанию Sesame на платформе разработки AI Hugging Face.

