BrainTools - Методики для развития мозга

Почему именно SEO так накинулись на нейросети и разбираются в них лучше многих

Что там у тебя внутри AI-машина

продолжить чтение

AI в работе продакта: что реально работает, а что остается хайпом

продолжить чтение

Как я за месяц перевела команду с SQL-промптов на мультиагентную систему и сэкономила команде 200 часов

Дарья Воронкина

продолжить чтение

Модель, которую боялись выпускать, теперь доступна всем. До 22 июня — бесплатно в подписке

Помните Claude Mythos? Ту самую модель Anthropic, которая в апреле находила уязвимости во всех основных ОС и браузерах, хотя её даже не учили этому специально. Тогда компания просто отказалась её выпускать. Доступ дали только Apple, Google, Microsoft и ещё паре гигантов, чтобы те успели залатать собственные дырыТак вот, вчера её выпустили. Называется Claude Fable 5

продолжить чтение

Откуда в обучении берётся nan: численная нестабильность в ML и почему всё считают в логарифмах

Модель обучается, loss падает, метрики растут. На какой‑то эпохе loss внезапно становится nan и больше не восстанавливается, как бы вы ни понижали learning rate. Или инференс на проде иногда возвращает вероятность ровно 1.0 для класса, которого в обучающей выборке почти не было, а в логах при этом тихо мелькает RuntimeWarning: overflow encountered in exp. Код не менялся, данные те же, гиперпараметры те же. Просто в какой‑то момент промежуточное число вышло за границу того, что тип float умеет хранить, и дальше вся арифметика поехала.

продолжить чтение

Как я осваивал LLM: взгляд старого зануды со своего чердака

В наше время продвинутых информационных технологий уже никого не удивишь ни дипфейками, ни искусственным интеллектом. ИИ есть почти у каждого в виде бота или приложения. С ним советуются, ему отправляют поисковые запросы, с ним ведут задушевные беседы.

продолжить чтение

Деплой LLM on-prem: Это наша корова и мы ее доим

Кто виноват? Что делать?(с)Заметили, что в наше веселое турбулентное время рождения многополярного мира все больше запросов на он-прем деплоймент ЛЛМ - а так как подводных камней там много, а опыта мало - то попробуем разобраться с вопросом.— Как дела с проектом?— Мы на финальной стадии!— Супер, сдаете?— Нет, ищем виноватого!

продолжить чтение

Signal назвал требование Великобритании сканировать устройства «антиутопией» и угрозой для всех пользователей

Signal опубликовал

продолжить чтение

Рабочий стол в LXC-контейнере: детективная история о протоколах, тупиках и самописном Wayland-композиторе

Wayland-рабочий стол с GPU в LXC-контейнере и стриминг через MoonlightВступление

продолжить чтение

Xiaomi разогнали 1T-модель до 1200 tok-s на стандартных GPU

Китайские команды MiMo и TileRT опубликовали режим UltraSpeed для модели MiMo V2.5 Pro (1,02T параметров).На одном 8-карточном сервере со стандартными GPU, до ~1200 токенов в секунду. Cerebras выдаёт похожие скорости на кастомном железе. Здесь обошлись без него.

продолжить чтение