Машинное обучение. - страница 8

Numenta проведет онлайн-симпозиум по запуску ИИ-фреймворка Thousand Brains Project

Джефф Хокинс, команда Numenta и Thousand Brains Project проведет онлайн-симпозиум по запуску опенсорс-проекта нового ИИ-фреймворка, созданного на основе 20 лет исследований и множества научных публикаций.Ранее я уже писал про Хоккинса на Хабре

продолжить чтение

Gemini вырывается вперед, Китай спамит моделями, в Minecraft запустили AI-агентов: главные события ноября в сфере ИИ

продолжить чтение

Интервью Forbes c Джоном Джампером из Google DeepMind о получении Нобелевской премии и будущем AlphaFold

В то время как языковые модели все лучше справляются с такими задачами, как написание стихов и электронных писем, Джампер надеется увидеть эру, когда ИИ будет решать проблемы, которые люди никогда не смогут решить самостоятельно.

продолжить чтение

AI copilot программист приличного уровня теперь оффлайн — Qwen 2.5.1 Coder 7B

Хорошая новость для тех, кто любит кодить на вершине горы Эверест, в Марианской впадине или из пасти дикого льва в африканской саванне (там, где качество доступа в интернет оставляет желать лучшего).  Qwen 2.5.1 Coder 7B! На днях в сеть (похоже случайно) утекла новая версия модели для программирования от Alibaba, а сегодня ее уже выложили официально. Эта модель весом в 7 миллиардов параметров демонстрирует очень достойные результаты на бенчмарке редактирования кода Aider:  всего на несколько процентов отстает от  GPT-4-1106-preview (модель от 6 ноября 2023), но работает полностью оффлайн!

продолжить чтение

Определены победители международного хакатона «Цифровой прорыв. Сезон: искусственный интеллект» 2024

Организаторы назвали

продолжить чтение

Tencent представила Hunyuan-Large — крупнейшую открытую модель с 389 миллиардами параметров

Недавно вышедшая Hunyuan-Large от Tencent, кажется, немного прошла мимо внимания широкой аудитории, а ведь это по-настоящему значимое событие в мире ИИ. На первый взгляд — очередная модель, но на деле — это крупнейшая открытая MoE (Mixture of Experts) модель на основе Transformer с впечатляющими 389 миллиардами параметров и 52 миллиардами активных параметров! Давайте разберёмся, почему это настолько важно и чем Hunyuan-Large может удивить даже искушённых специалистов.

продолжить чтение

Яндекс наградил 14 учёных за достижения в сфере машинного обучения

В этом году мы в шестой раз вручили научную премию в области машинного обучения Yandex ML Prize

продолжить чтение

OpenAI заявляет, что не будет выпускать модель под названием Orion в этом году

Компания OpenAI опровергла информацию о планах по выпуску новой модели под кодовым названием Orion в этом году, несмотря на недавние сообщения о её готовящемся запуске.

продолжить чтение

Выяснилось, что LLM могут считать, что 9.8 < 9.11, из-за Библии, физики или даже теракта 11 сентября

Исследователи из Transluce – только что анонсированной некоммерческой ИИ лаборатории – создали инструмент Monitor, который поможет людям наблюдать, понимать и управлять внутренними вычислениями языковых моделей. В ходе экспериментов ученые рассмотрели несколько известных задач, в которых LLM традиционно ошибаются, и выяснили, с чем могут быть связаны такие галлюцинации.

продолжить чтение

Погружение в Sampling method: механизмы работы в моделях диффузии

Метод выборки (sampling method) в генеративных моделях, таких как Stable Diffusion или FLUX, определяет способ преобразования случайного шума в изображение в процессе диффузии. Этот метод напрямую влияет на качество, стиль и скорость генерации изображения.В предыдущей статье

продолжить чтение

Rambler's Top100