Anthropic представила новый метод защиты больших языковых моделей от взломов
Спустя два года после появления ChatGPT на рынке появилось множество больших языковых моделей (LLM), и почти все они по-прежнему уязвимы для взлома — специальных запросов и других обходных путей, которые заставляют их генерировать вредоносный контент.
Как защитить серверы критических отраслей от удаленного взлома и физического проникновения
Привет, Хабр! Как давно вы мониторили рынок современных аппаратно-программных комплексов защиты серверов и серверного оборудования? С тех пор как доступ западных новинок на наш рынок сократился под давлением внешних факторов, начала стремительно расти актуальность отечественных разработок в области надежной и эффективной защиты данных на уровне железа. Этот рост стимулировали законодательные инициативы, ужесточившие требования к локализации систем защиты. Например, был принят
Исследователи продемонстрировали джейлбрейк по взлому роботов с ИИ
IEEE Spectrum представил отчёт с описанием случая, когда взломанные роботы могли использоваться для вредящих людям действий. Исследователи отмечают, что роботов с ИИ оказалось взломать так же легко, как и чат-ботов.
Чем ещё тимлиду заняться в ноябре
В ноябре выйдет новая версия TeamLead Conf 27.28.11.2024. Предпродажи уже идут! Проведём небольшой обзор предстоящего мероприятия и поговорим о том, что нам уже известно о новой версии.Сначала, как водится в обзорах, расскажу о дизайне. Внешне отличий немного. Наверное, всё дело в том, что используемый стиль супрематизма давно сформирован и узнаваем, и менять его — нет никакого смысла.