ByteDance выпустили OmniHuman-1: генерация видео по одной картинке и аудиодорожке
Ссылка на официальный анонс (англ): https://omnihuman-lab.github.io/Примеры некоторых сгенерированных видосов под катом, но на Хабре не очень удобный плеер, поэтому остальные я выложил в телеге.Анимация человека, а именно - генерация говорящего человека на основе аудиодорожки за последние годы сильно прокачалась в качестве. Но существующие подходы всё ещё испытывают трудности с масштабированием.
Рецензия на переводную книгу “Машинное обучение с малым объемом кодирования” (Low-Code AI)
Как кажется, основные читатели книги "Low-Code AI"
PicTrace-X1: Как умные очки и нейросети меняют поиск изображений — от браузера до навигации
Современный цифровой мир генерирует терабайты визуальных данных ежедневно. Рутинные задачи — маркетинговый анализ, модерация контента, обеспечение безопасности или разработка умных очков и протезов для людей с ограниченными возможностями — требуют мгновенного доступа к релевантным изображениям. Ручной поиск не только замедляет процессы, но и подвержен человеческим ошибкам.В данной статье мы рассмотрим, как интеграция инструментов автоматизированного поиска схожих изображений, цифрового зрения и навигационных систем
Цензура в DeepSeek работает при локальном запуске модели
Некоторые эксперты в области искусственного интеллекта считали, что хорошо задокументированная цензура DeepSeek существует только на уровне приложения и не работает, если запустить приложение локально на устройстве. Теперь выяснилось, что это не так.
Вышла YuE — открытая модель машинного обучения для генерации музыки
Исследователи Гонконгского университета науки и технологии представили открытую нейросеть для генерации музыки. Авторы проект называют свою разработку бесплатным аналогом Suno. Модель может генерировать инструментальные композиции и песни.
Anthropic представила новый метод защиты больших языковых моделей от взломов
Спустя два года после появления ChatGPT на рынке появилось множество больших языковых моделей (LLM), и почти все они по-прежнему уязвимы для взлома — специальных запросов и других обходных путей, которые заставляют их генерировать вредоносный контент.
Почему логика запрещает дальше жить: вызовы ИИ и новая реальность
«Человек – это канат, натянутый между животным и сверхчеловеком, – канат над пропастью. Опасно прохождение, опасно быть в пути, опасен взор, обращенный назад, опасны страх и остановка. В человеке важно то, что он мост, а не цель: в человекеможно любить только то, что он переход и гибель».(Ф. Ницше, «Так говорил Заратустра»). Предел человеческого разума Развитием движет непрерывная конкуренция. Соперничают идеологии, государства, бизнесы и люди. Побеждает тот, чьи решения лучше, т.е. кто лучше управляет своими активами.
ИИ отправился искать жизнь в компьютерных симуляциях
Поиск искусственной жизни (artificial life или A-life) — это область науки, исследующая модели живых систем и их эволюцию в контролируемых условиях, чаще всего — в компьютерных симуляциях. поиски эти раньше часто проводились вручную, а рисерчеры из ИИ-лаборатории Sakana AI предложили новый подход к автоматизации поиска с использованием ИИ моделей, таких как CLIP.
Бесплатный онлайн-тренажер по SQL, телеграм-бот для быстрой подписи PDF-документов – и еще 8 российских стартапов
10 новых российских продуктов для превращения альбомов в VK в онлайн-выставки, проверки и оценки земельных участков в РФ, мониторинга новостей и многого другого. Битва за «Продукт недели» началась!Product Radar — здесь каждую неделю публикуются лучшие онлайн-сервисы и железки от русскоязычных команд.Это площадка, где энтузиасты из мира технологий делятся своими идеями, обсуждают и создают вместе новые продукты, чтобы делать жизнь людей лучше.Победители прошлой неделиInvestic
DeepSeek-R1 для чайников
В последние месяцы всё чаще слышим про «reasoning-модели», способные не просто продолжать текст, а действительно шаг за шагом решать сложнейшие задачи цепочкой рассуждений (chain-of-thought). Впервые такой подход эффектно показали в OpenAI o1, но, к сожалению, подробности там остаются секретными. Недавно же команда DeepSeek наделала шуму с открытыми вариантами R1 и R1-Zero, созданными поверх их собственной большой MoE-модели DeepSeek-V3. В этом посте я не стану углубляться в вопрос «чья модель лучше — o1 или R1». Зато разберу, какие главные технические детали