Голосовые интерфейсы.

Anthropic готовит конкурента голосовому режиму OpenAI в ChatGPT

Anthropic готовится представить новую функцию «голосового режима», которая может составить конкуренцию аналогичной функции OpenAI в ChatGPT, согласно Bloomberg. Сообщается, что голосовой помощник на базе ИИ будет доступен в чат-боте Claude AI и может начать работу «уже в этом месяце».

продолжить чтение ......

Оставлено в

Обновление «Алисы»: поддержка английского языка, работа с файлами, рассуждения и Live-режим

«Яндекс» представила обновление нейросетевого ассистента «Алисы». Компания добавила поддержку английского языка, рассуждения, поиск, возможность работать с файлами и Live-режим. Обновления показали 15 апреля 2025 года в рамках презентации умных устройств «Яндекса».

продолжить чтение ......

Оставлено в

Имитированные голоса Маска и Цукерберга звучат со взломанных кнопок пешеходных переходов

Кнопки на пешеходных переходах как минимум в трёх городах Калифорнии, судя по всему, были взломаны в эти выходные, чтобы придать им голоса, сгенерированные искусственным интеллектом, генерального директора Tesla Илона Маска и генерального директора Meta* Марка Цукерберга.

продолжить чтение ......

Оставлено в

Беспрецедентный сдвиг в голосовых интерфейсах ИИ

Всем привет! Меня зовут Александр, я COO в SaaS-платформе аналитики данных. Последний год активно изучаю внедрение AI-решений в кросс-функциональные процессы. Делюсь материалами, которые помогают:Продуктовым менеджерам — интегрировать AI без перегрузки команд;Разработчикам — выбирать инструменты под конкретные бизнес-задачи;Специалистам по данным — избегать ошибок в production-развертывании.У себя в телеграм-канале делюсь сжатыми и структурированными саммери статей.Сегодняшний перевод — When machines learn to speak

продолжить чтение ......

Оставлено в

Amazon представила Nova Sonic: новую модель генеративного ИИ для обработки голоса

Во вторник компания Amazon представила новую модель генеративного искусственного интеллекта Nova Sonic, способную обрабатывать голос и генерировать естественную речь. Amazon утверждает, что производительность Sonic сопоставима с передовыми моделями обработки голоса от OpenAI и Google по таким показателям, как скорость, распознавание речи и качество общения.

продолжить чтение ......

Оставлено в

Как я запускаю 15+ самых разных ИИ на своей машине — open-source, self-hosted, с HTTP-доступом

TLDR: я написал BrainBox — local-first сервис поддержки open-source ИИ-систем для генерации изображений, распознавания объектов на снимках, озвучки, распознавания текстов, транскрибирования аудиозаписей и других целей. Эти системы запускаются за фасадом веб-сервера, который устанавливает их и затем принимает и выполняет задачи в едином для всех систем формате. Задачи можно ставить из любого языка программирования с помощью отправки веб-запросов на сервер, а для Python дополнительно разработан удобный API. Проект доступен на pypi https://pypi.org/project/kaia-brainbox/

продолжить чтение ......

Оставлено в

OpenAI выпускает новое поколение аудиомоделей: улучшенное распознавание и настройка стиля речи ИИ

Компания OpenAI выпустила новое поколение аудиомоделей, которые позволяют разработчикам настраивать речь своих ИИ-помощников. Обновление включает улучшенное распознавание речи и возможность управлять стилем речи ИИ с помощью простых текстовых команд.

продолжить чтение ......

Оставлено в

Сообщается, что Anthropic готовит голосовой режим для Claude

Согласно отчёту, стартап Anthropic, занимающийся искусственным интеллектом, работает над голосовыми возможностями своего чат-бота Claude на базе искусственного интеллекта.

продолжить чтение ......

Оставлено в

Будущее v-commerce: как использовать распознавание речи и голосовой поиск в 2025 году

Шопинг с использованием голоса уже не кажется чем-то удивительным. По данным опроса Департамента социальных исследований и консалтинга ВЦИОМ Андрей Даудрих, среди 63% россиян, которые использовали ИИ-инструменты в. 2024 году, 31% прибегали преимущественно к голосовым помощникам.

продолжить чтение ......

Оставлено в

Записи автоответчиков стали использовать для создания дипфейков

Мошенники могут использовать персональные голосовые приветствия на автоответчиках для создания дипфейков — об этом предупредили эксперты. Эти записи позволяют злоумышленникам при помощи нейросетей имитировать голос потенциальной жертвы и в дальнейшем использовать его при атаках на её окружение, пишут «Известия».

продолжить чтение ......

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

Голосовые интерфейсы.

Anthropic готовит конкурента голосовому режиму OpenAI в ChatGPT

Обновление «Алисы»: поддержка английского языка, работа с файлами, рассуждения и Live-режим

Имитированные голоса Маска и Цукерберга звучат со взломанных кнопок пешеходных переходов

Беспрецедентный сдвиг в голосовых интерфейсах ИИ

Amazon представила Nova Sonic: новую модель генеративного ИИ для обработки голоса

Как я запускаю 15+ самых разных ИИ на своей машине — open-source, self-hosted, с HTTP-доступом

OpenAI выпускает новое поколение аудиомоделей: улучшенное распознавание и настройка стиля речи ИИ

Сообщается, что Anthropic готовит голосовой режим для Claude

Будущее v-commerce: как использовать распознавание речи и голосовой поиск в 2025 году

Записи автоответчиков стали использовать для создания дипфейков

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

Голосовые интерфейсы.