DiffSplat: генерация 3D-объектов с помощью диффузионных моделей изображений
Полезно было бы уметь генерировать по текстовому описанию не только картинки, а полноценный 3D-объект, который можно рассмотреть со всех сторон. Это открывает огромные возможности для дизайна, игр, виртуальной реальности. Однако генерация 3D-контента — задача непростая. Современные методы требуют огромных объемов данных для обучения и страдают от несогласованности между разными ракурсами.
Нейросети для локальной генерации видео
Давно было понятно, что генерация видео с помощью нейросетей станет возможной локально на ПК. Это полезно для всех, кто не готов платить за подписки, но готов платить за мощное железо. Потому что видео-модели требуют значительных вычислительных ресурсов.На текущий момент существует несколько ключевых моделей, которые подходят для локальной установки: stable Video Diffusion, Mochi 1, Hunyan Video и LTX Video. Каждая из них имеет свои уникальные особенности, которых ниже.Stable Video Diffusion (SVD)
От каскадных моделей до картинок в 4к: как эволюционировали диффузионки
На дворе 2025 год. Генерацией картинок и видео в интернете больше никого не удивишь. Генеративный контент повсюду, а его качество настолько высоко, что бывает трудно отличить синтетическую картинку от реальной.
Перенос головы с картинки — сложно ли это? Модель GHOST-2.0
В последнее время технологии замены лиц находят все больше применений. Помимо использования в развлекательных целях, они стали особенно важны для индустрии фильмов и рекламы, позволяя существенно ускорить и удешевить производство. Несколько лет назад мы так же не остались в стороне от этой темы и выпустили свою модель переноса лиц с фото на фото или видео (в простонародье, face swap) — GHOST. Основная фишка модели была в отсутствии необходимости обучать её под каждый новый источник переноса лица — весь процесс буквально происходил по одной фотке (отсюда и буквы “OS=one shot” в названии модели)
Погружение в мир диффузионных моделей — путеводитель для новичков
Диффузионные модели перевернули мир генеративного искусственного интеллекта, вытеснив GAN'ы и вариационные автоэнкодеры. Но как они работают? Чем отличаются друг от друга? И как научиться их использовать?Эта статья — путеводитель для тех, кто хочет разобраться в диффузионных моделях с нуля. В ней вы найдете
Почему крупным компаниям стоит внедрять экспертную систему для управления проектами?
Современные IT-компании, работающие с большими объёмами данных и сложными проектами, неизбежно сталкиваются с проблемами координации, распределения ресурсов и принятия управленческих решений.
Сэм Альтман знает, как достичь AGI. Я тоже, и сейчас расскажу как
«Теперь мы уверены, что знаем, как построить AGI в том виде, в каком мы традиционно его понимали… Сейчас это звучит как научная фантастика, и даже говорить об этом как-то безумно. Все в порядке — мы уже были там раньше и не против оказаться там снова.»Такой пост 6 января Альтман опубликовал в своем блоге. Интересно, что перед этим он даже сказал, что AGI будет при Трампе, то есть до января 2029 года. Может показаться, что он готовится к очередному раунду приема пожертвований на GPU, и это приглашение сделать пожертвование побольше. Я уверен, что это не так.
Я решила отдохнуть от решений и поручила управление своей жизнью искусственному интеллекту
Генеративный ИИ взял на себя управление моей жизнью.В течение одной недели он указывал мне, что есть, что носить и чем заниматься с детьми. Он выбирал, как мне подстричься и в какой цвет покрасить мой офис. Он сообщил моему мужу, что играть в гольф можно, в любовном сообщении, которое, как он сразу понял, я не писала.
Яндекс наградил 14 учёных за достижения в сфере машинного обучения
В этом году мы в шестой раз вручили научную премию в области машинного обучения Yandex ML Prize