Блог компании BotHub. - страница 4

Deepseek V3 становится самой мощной открытой языковой моделью в Китае на сегодня

Китайская компания Deepseek только что выпустила свою самую мощную языковую модель. Первые тесты показывают, что новая модель V3 может конкурировать с ведущими проприетарными моделями в отрасли и демонстрирует значительное улучшение в задачах логического мышления.Модель, доступная на Github, использует архитектуру Mixture-of-Experts (MoE) с общим количеством параметров 671 миллиард, из которых 37 миллиардов активируются для каждого токена. Это значительное увеличение по сравнению с V2, которая имеет 236 миллиардов параметров, из которых 21 миллиард активен во время вывода.

продолжить чтение

Tetsuwan Scientific создает роботов-ученых с AI, которые могут самостоятельно проводить эксперименты

продолжить чтение

SandboxAQ создает новое поколение AI для бизнеса

В последние годы разговоры о корпоративном AI сосредоточились на LLM и генеративном AI . Однако, как показывает практика, есть и другие подходы, которые могут принести значительную пользу предприятиям. Одним из таких подходов являются крупные количественные модели LQM, которые обучаются на оптимизации специфических целей и параметров, таких как свойства материалов и финансовые риски. В этом контексте компания SandboxAQ выделяется как один из ведущих игроков, недавно привлекшая 300 миллионов долларов в новом раунде финансирования.

продолжить чтение

Прогресс в AGI вызывает сомнения

Тест ARC-AGI (сокр. Abstract and Reasoning Corpus for Artificial General Intelligence), созданный в 2019 году ведущей фигурой в AI Франсуа Шолле для оценки способностей искусственного интеллекта к обучению, показывает улучшение результатов. Однако это может свидетельствовать скорее о недочетах в самом тесте, чем о реальном прорыве в развитии ИИ.

продолжить чтение

OpenAI заявляет, что не будет выпускать модель под названием Orion в этом году

Компания OpenAI опровергла информацию о планах по выпуску новой модели под кодовым названием Orion в этом году, несмотря на недавние сообщения о её готовящемся запуске.

продолжить чтение

Qwen2-Math — Alibaba Cloud выпустила серию LLM для решения математических задач любой сложности

Alibaba Cloud представила Qwen2-Math, новую серию LLM с открытым исходным кодом, предназначенную для решение математических задач. Модели основаны на платформе Qwen2, которая уже используется многими компаниями, преимущественно в Китае.

продолжить чтение

Нейронные связи и предсказание поведения: ИИ в глубинах мозга плодовой мушки

Молодой ученый Бенджамин Коули и его команда из Лаборатории Колд-Спринг-Харбор (CSHL) разработали специальную ИИ-модель мозга обычной плодовой мушки для моделирования и понимания его работы в контексте зрительного восприятия и поведения.

продолжить чтение

ИИ и прогнозирование микроэлементов для борьбы с загрязнением воды

В последние десятилетия угроза загрязнения водных ресурсов стала одной из наиболее беспокоящих экологических проблем. С ростом мирового потребления фармацевтических препаратов в 2020 году оно достигло 4 миллиардов доз, и как следствие, водные системы сталкиваются с увеличением количества и разнообразия микроэлементов, попадающих в очистные сооружения. Эти вещества, часто неизвестные и трудно поддающиеся анализу, могут оказать вредное воздействие на окружающую среду и здоровье человека, включая канцерогенез и эндокринные нарушения.

продолжить чтение

Биокомпьютер Brainoware, связывающий ИИ и органоиды мозга: обзор потенциального прорыва в сфере нейроморфной инженерии

Нейроморфная инженерия является инновационной областью исследований, объединяющей принципы когнитивных наук и передовые технологии. Вашему вниманию представлен обзор Brainoware, связующего звена мозговых органоидов и искусственного интеллекта. Мы вспоминаем о недостатках кремниевых чипов и даём краткий экскурс о суперкомпьютере, пытавшемся воспроизвести функционал человеческого мозга. Также подробно рассказываем об устройстве Brainoware, приводим результаты тестов, мнения учёных и исследователей, а также пытаемся посмотреть за горизонты вычислительных технологий.

продолжить чтение

Rambler's Top100