Deepseek V3 становится самой мощной открытой языковой моделью в Китае на сегодня
Китайская компания Deepseek только что выпустила свою самую мощную языковую модель. Первые тесты показывают, что новая модель V3 может конкурировать с ведущими проприетарными моделями в отрасли и демонстрирует значительное улучшение в задачах логического мышления.Модель, доступная на Github, использует архитектуру Mixture-of-Experts (MoE) с общим количеством параметров 671 миллиард, из которых 37 миллиардов активируются для каждого токена. Это значительное увеличение по сравнению с V2, которая имеет 236 миллиардов параметров, из которых 21 миллиард активен во время вывода.
Tetsuwan Scientific создает роботов-ученых с AI, которые могут самостоятельно проводить эксперименты
SandboxAQ создает новое поколение AI для бизнеса
В последние годы разговоры о корпоративном AI сосредоточились на LLM и генеративном AI . Однако, как показывает практика, есть и другие подходы, которые могут принести значительную пользу предприятиям. Одним из таких подходов являются крупные количественные модели LQM, которые обучаются на оптимизации специфических целей и параметров, таких как свойства материалов и финансовые риски. В этом контексте компания SandboxAQ выделяется как один из ведущих игроков, недавно привлекшая 300 миллионов долларов в новом раунде финансирования.
Прогресс в AGI вызывает сомнения
Тест ARC-AGI (сокр. Abstract and Reasoning Corpus for Artificial General Intelligence), созданный в 2019 году ведущей фигурой в AI Франсуа Шолле для оценки способностей искусственного интеллекта к обучению, показывает улучшение результатов. Однако это может свидетельствовать скорее о недочетах в самом тесте, чем о реальном прорыве в развитии ИИ.
OpenAI заявляет, что не будет выпускать модель под названием Orion в этом году
Компания OpenAI опровергла информацию о планах по выпуску новой модели под кодовым названием Orion в этом году, несмотря на недавние сообщения о её готовящемся запуске.
Qwen2-Math — Alibaba Cloud выпустила серию LLM для решения математических задач любой сложности
Alibaba Cloud представила Qwen2-Math, новую серию LLM с открытым исходным кодом, предназначенную для решение математических задач. Модели основаны на платформе Qwen2, которая уже используется многими компаниями, преимущественно в Китае.
Нейронные связи и предсказание поведения: ИИ в глубинах мозга плодовой мушки
Молодой ученый Бенджамин Коули и его команда из Лаборатории Колд-Спринг-Харбор (CSHL) разработали специальную ИИ-модель мозга обычной плодовой мушки для моделирования и понимания его работы в контексте зрительного восприятия и поведения.
ИИ и прогнозирование микроэлементов для борьбы с загрязнением воды
В последние десятилетия угроза загрязнения водных ресурсов стала одной из наиболее беспокоящих экологических проблем. С ростом мирового потребления фармацевтических препаратов в 2020 году оно достигло 4 миллиардов доз, и как следствие, водные системы сталкиваются с увеличением количества и разнообразия микроэлементов, попадающих в очистные сооружения. Эти вещества, часто неизвестные и трудно поддающиеся анализу, могут оказать вредное воздействие на окружающую среду и здоровье человека, включая канцерогенез и эндокринные нарушения.
Биокомпьютер Brainoware, связывающий ИИ и органоиды мозга: обзор потенциального прорыва в сфере нейроморфной инженерии
Нейроморфная инженерия является инновационной областью исследований, объединяющей принципы когнитивных наук и передовые технологии. Вашему вниманию представлен обзор Brainoware, связующего звена мозговых органоидов и искусственного интеллекта. Мы вспоминаем о недостатках кремниевых чипов и даём краткий экскурс о суперкомпьютере, пытавшемся воспроизвести функционал человеческого мозга. Также подробно рассказываем об устройстве Brainoware, приводим результаты тестов, мнения учёных и исследователей, а также пытаемся посмотреть за горизонты вычислительных технологий.