Почему именно SEO так накинулись на нейросети и разбираются в них лучше многих
Что там у тебя внутри AI-машина
Как я за месяц перевела команду с SQL-промптов на мультиагентную систему и сэкономила команде 200 часов
Дарья Воронкина
Модель, которую боялись выпускать, теперь доступна всем. До 22 июня — бесплатно в подписке
Помните Claude Mythos? Ту самую модель Anthropic, которая в апреле находила уязвимости во всех основных ОС и браузерах, хотя её даже не учили этому специально. Тогда компания просто отказалась её выпускать. Доступ дали только Apple, Google, Microsoft и ещё паре гигантов, чтобы те успели залатать собственные дырыТак вот, вчера её выпустили. Называется Claude Fable 5
Откуда в обучении берётся nan: численная нестабильность в ML и почему всё считают в логарифмах
Модель обучается, loss падает, метрики растут. На какой‑то эпохе loss внезапно становится nan и больше не восстанавливается, как бы вы ни понижали learning rate. Или инференс на проде иногда возвращает вероятность ровно 1.0 для класса, которого в обучающей выборке почти не было, а в логах при этом тихо мелькает RuntimeWarning: overflow encountered in exp. Код не менялся, данные те же, гиперпараметры те же. Просто в какой‑то момент промежуточное число вышло за границу того, что тип float умеет хранить, и дальше вся арифметика поехала.
Как я осваивал LLM: взгляд старого зануды со своего чердака
В наше время продвинутых информационных технологий уже никого не удивишь ни дипфейками, ни искусственным интеллектом. ИИ есть почти у каждого в виде бота или приложения. С ним советуются, ему отправляют поисковые запросы, с ним ведут задушевные беседы.
Деплой LLM on-prem: Это наша корова и мы ее доим
Кто виноват? Что делать?(с)Заметили, что в наше веселое турбулентное время рождения многополярного мира все больше запросов на он-прем деплоймент ЛЛМ - а так как подводных камней там много, а опыта мало - то попробуем разобраться с вопросом.— Как дела с проектом?— Мы на финальной стадии!— Супер, сдаете?— Нет, ищем виноватого!
Signal назвал требование Великобритании сканировать устройства «антиутопией» и угрозой для всех пользователей
Signal опубликовал
Рабочий стол в LXC-контейнере: детективная история о протоколах, тупиках и самописном Wayland-композиторе
Wayland-рабочий стол с GPU в LXC-контейнере и стриминг через MoonlightВступление
Xiaomi разогнали 1T-модель до 1200 tok-s на стандартных GPU
Китайские команды MiMo и TileRT опубликовали режим UltraSpeed для модели MiMo V2.5 Pro (1,02T параметров).На одном 8-карточном сервере со стандартными GPU, до ~1200 токенов в секунду. Cerebras выдаёт похожие скорости на кастомном железе. Здесь обошлись без него.
