Высокая производительность.

Метрики SAR в Linux подробно: что они означают и как их читать

Состояние сервера можно условно сравнить со здоровьем человека: оно у всех разное и умирают все от разных причин. Пульс, давление, температура — это показатели, которые помогают в диагностике нас. В мире Linux эти показатели: CPU, использование памяти, работа дисков и прочее. Как и в медицине, мониторинг можно проводить в реальном времени или анализировать уже собранные данные.

продолжить чтение ......

Оставлено в

Perforator: новая система непрерывного профилирования теперь в опенсорсе

Привет! Сегодня мы выложили в опенсорс Perforator — систему непрерывного профилирования (continuous profiling), которую используем внутри Яндекса для анализа производительности большинства сервисов.В Github‑репозитории

продолжить чтение ......

Оставлено в

Что нового в Postgres Pro Enterprise 17: от Proxima до интеллектуального управления данными

Объём статьи не позволяет детально описать все новшества вышедшей версии Postgres Pro Enterprise 17, поэтому мы решили опубликовать краткий обзор со ссылками на более детальную информацию.Proxima — три в одном для масштабирования и производительности

продолжить чтение ......

Оставлено в

Экономика. Общие положения. Часть I

Экономика изучает человеческое общество так же, как физика изучает физический мир.Конечно, человек – это не элементарная частица, но и его поведение подчиняется определенным законам. Законы, по которым люди взаимодействуют друг с другом, объективны и не подвластны нашему желанию, так же как ему не подвластны законы

продолжить чтение ......

Оставлено в

Оптимизация Trellis: запускаем генерацию 3D моделей на GPU с 8ГБ памяти

Привет, Хабр! Я оптимизировал Trellis — мощный AI-инструмент для генерации 3D моделей из изображений, и хочу поделиться тем, как удалось снизить требования к видеопамяти с 16GB до 8GB, сохранив качество генерации.Что такое Trellis и почему это важноTrellis — модель для генерации 3D-ассетов, разработанная Microsoft Research, способная создавать трёхмерные объекты из изображений. Её ключевая особенность — универсальный Structured LATent (SLAT) формат, за счет которого можно генерировать различные выходные форматы: от Radiance Fields и 3D Gaussians до полноценных мешей.

продолжить чтение ......

Оставлено в

Мечтают ли электроовцы об андроидах?

В научном журнале Society вышло исследование

продолжить чтение ......

Оставлено в

Будущее дата-центров — ИИ и ядерные реакторы

Малый ядерный реактор NuScale Power Сейчас ЦОДы потребляют примерно 2% электроэнергии в мире, но в будущем их доля значительно возрастёт: по некоторым прогнозам, превысит 20% к 2030 году, а в отдельных странах вроде Ирландии превысит 30%. Идея питания ЦОДов от малых ядерных реакторов кажется вполне здравой. В конце концов, это экологически чистый источник энергии, который не загрязняет окрестности дымом, шумом и вредными газами.

продолжить чтение ......

Оставлено в

Алгоритмы спекулятивного инференса LLM

ВведениеЗа последние годы качество LLM моделей сильно выросло, методы квантизации стали лучше, а видеокарты мощнее. Тем не менее качество генерации все еще напрямую зависит от размера весов и, как следствие, вычислительной сложности. Кроме того, генерация текста авторегрессионна - токен за токеном по одному, потому ее сложность зависит от размера контекста и количества генерируемых токенов.Но генерация текста не всегда имеет однородную сложность, так же как мы во многом мыслим идеями, а слова произносим “на автомате”. В статье обсудим алгоритмы, позволяющие использовать эту неоднородность для ускорения.

продолжить чтение ......

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

Высокая производительность.

Метрики SAR в Linux подробно: что они означают и как их читать

Perforator: новая система непрерывного профилирования теперь в опенсорсе

Что нового в Postgres Pro Enterprise 17: от Proxima до интеллектуального управления данными

Экономика. Общие положения. Часть I

Оптимизация Trellis: запускаем генерацию 3D моделей на GPU с 8ГБ памяти

Мечтают ли электроовцы об андроидах?

Будущее дата-центров — ИИ и ядерные реакторы

Алгоритмы спекулятивного инференса LLM

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

Высокая производительность.