Factorio пополняет список видеоигр, которые также тестируют производительность AI
Factorio, сложная компьютерная игра, ориентированная на строительство и управление ресурсами, стала последним инструментом исследователей для оценки возможностей AI. Игра проверяет способность языковых моделей планировать и строить сложные системы, управляя при этом множеством ресурсов и производственных цепочек.
Уроки химии: AMORE проверит готовность химических языковых моделей
Привет! Мы, команда NLP‑исследователей из AIRI и Сбера, опубликовали недавно результаты исследования того, как языковые модели справляются с химическими задачами. Дело в том, что в последние годы интеграция методов обработки естественного языка в области химии неуклонно растёт, и это открывает новые горизонты для открытия лекарств. Однако возникает важный вопрос: действительно ли современные языковые модели научились понимать молекулы, или они просто запоминают их текстовые представления?Чтобы выяснить это, мы создали ♡AMORE
Модели T-lite и T-pro: training report
Привет! Я Дима Стоянов, MLE в команде разработки фундаментальных моделей. Мы продолжаем рассказывать о наших моделях T-lite и T-pro. Общие характеристики и результаты бенчмарков описывали в предыдущей публикации. В этой статье раскроем детали предобучения: от подготовки данных до финальных экспериментов, а совсем скоро поделимся особенностями этапа post-training.
Сокращения в IT: разбираемся, в чём виноват искусственный интеллект
Статью для Minervasoft написала фронтенд-разработчик. В своем исследовании она опиралась на официальные новости, статистику, мнения людей с форумов и свой профессиональный опыт.ИИ берёт на себя рутину, снижает ошибки и помогает компаниям уменьшать расходы — в теории.
ИИ, экономика и найм в IT: разбираемся, что происходит на рынке
Статью для Minervasoft написала фронтенд-разработчик. В своем исследовании она опиралась на официальные новости, статистику, мнения людей с форумов и свой профессиональный опыт.ИИ берёт на себя рутину, снижает ошибки и помогает компаниям снижает расходы — так объясняют сокращения западные корпорации.
Новый метод подсказок повышает точность и проверяемость ответов языковых моделей
Новый метод подсказок под названием «Highlighted Chain of Thought» (Выделенная цепочка мыслей)(HoT) помогает большим языковым моделям лучше объяснять свои рассуждения и упрощает проверку их ответов людьми. Подход работает в два этапа: во-первых, AI переформулирует исходный вопрос и отмечает важные факты с помощью XML-тегов. Затем он генерирует ответ, который ссылается на эти выделенные факты, создавая четкие связи между вопросом и ответом.
Русскоязычные LLM: отечественные разработки в сравнении с глобальными адаптациями
Современные языковые модели (они же LLM, они же Large Language Models) становятся все более востребованными практически во всех сферах. LLM уже не просто инструмент, а важнейшая часть технологического прогресса, позволяющая автоматизировать работу с текстами, проводить анализ данных, генерировать контент и даже серьезно помогать в обучении.
BotHub, GPTunnel, Chad AI — считаем где ChatGPT дешевле в России
Сейчас на фоне стремительной популяризации нейросетей, в России появилось достаточно много сервисов и агрегаторов, обеспечивающих удобный доступ к популярным языковым моделям без использования VPN. Однако при выборе подходящего решения мы зачастую сталкиваемся с проблемой разношерстной тарификация: у одних внутренняя валюта, у других стоимость за слова, третьи считают символы или количество токенов в запросе.
Deepseek: как превратить языковые модели в прибыльный бизнес, несмотря на снижение цен на рынке
В недавно опубликованных данных Deepseek говорится о том, что языковые модели могут приносить ощутимую выгоду, даже если их стоимость будет ниже, чем у OpenAI.Компания Deepseek предоставила