Голосовой ИИ становится быстрее, умнее и естественнее. Cartesia, компания, специализирующаяся на голосовых технологиях на основе ИИ в реальном времени, привлекла 64 миллиона долларов в рамках раунда серии A, возглавляемого Kleiner Perkins. Это финансирование позволит ускорить исследования, расширить команду и усовершенствовать Sonic 2.

Sonic 2.0 предназначен для генерации сверхреалистичной речи с низкой задержкой, что делает его идеальным в создании творческого контента и общении в реальном времени.
Модель использует архитектуру с пространством состояний, что позволяет удвоить её размер по сравнению с предшественником, сохраняя при этом более высокую скорость и эффективность. Она обеспечивает задержку в 90 миллисекунд для полных моделей и ещё более быструю задержку в 40 миллисекунд в приложениях реального времени — показатели производительности, которые превосходят показатели конкурентов.
Помимо скорости, технология Cartesia отлично справляется с клонированием голоса, позволяя генерировать реалистичную речь, которая передаёт тонкие нюансы, акценты и тональные вариации. Это делает её особенно полезной в тех случаях, когда точность имеет решающее значение, например, при обслуживании клиентов, локализации контента и использовании специальных возможностей. Компания также представила Sonic Turbo — улучшенную версию, которая обеспечивает ещё более быстрый синтез.
Инфраструктура Cartesia создана для обеспечения надёжности на уровне предприятия и может похвастаться 99,9% времени безотказной работы и соответствием стандартам SOC-2 и HIPAA. Sonic API разработан для разработчиков и предлагает надёжную работу в режиме реального времени и возможности развёртывания на устройствах, что может сделать приложения для генерации голоса на основе ИИ более удобными в различных отраслях.
Генеральный директор Кар подчеркнул, что голосовой ИИ готов стать повсеместным, а голоса, генерируемые ИИ в реальном времени, всё чаще используются в приложениях — от колл-центров до виртуальных помощников. «Это год голосового ИИ, и он будет повсюду», — сказал он во время презентации.
Благодаря этому финансированию Cartesia стремится усовершенствовать свои модели голосового ИИ, интегрировать новые функции, такие как смена голоса и редактирование текста, а также продвигать инновации в потоковых архитектурах и выводе данных на устройстве. По мере усиления гонки ф области ИИ внимание Cartesia к скорости, контролю и естественности может сделать её ключевым игроком в развивающейся экосистеме голосового ИИ.
Автор: mefdayy