- BrainTools - https://www.braintools.ru -
Недавно вышедшая Hunyuan-Large от Tencent [1], кажется, немного прошла мимо внимания [2] широкой аудитории, а ведь это по-настоящему значимое событие в мире ИИ. На первый взгляд — очередная модель, но на деле — это крупнейшая открытая MoE (Mixture of Experts) модель на основе Transformer с впечатляющими 389 миллиардами параметров и 52 миллиардами активных параметров! Давайте разберёмся, почему это настолько важно и чем Hunyuan-Large может удивить даже искушённых специалистов.
Основные достоинства модели:
Возможность обработки супер-длинных контекстов — поддержка текстов до 256 тысяч токенов. Это значит, что модель может легко справляться с массивными документами, сохраняя связность и внимание к деталям даже в самых длинных текстах.
Эффективность использования памяти [3] — Hunyuan-Large задействует инновационные методы, такие как сжатие кеша и адаптивные уровни обучения [4] для «экспертов», что позволяет снижать нагрузку на ресурсы и поддерживать высокую производительность.
Точность на уровне лучших — модель уверенно показывает себя на бенчмарках вроде MMLU, CMMLU и других. Она не просто конкурирует, но и превосходит ряд известных моделей в задачах на понимание и анализ текста.
Итак, если вы ещё не обратили внимание на эту модель — самое время присмотреться! Tencent открывает доступ к Hunyuan-Large, приглашая исследователей и разработчиков к сотрудничеству и совместной работе над расширением границ искусственного интеллекта [5]. Ну и ждем 32b, 14b и 7b версии!
На Huggingface имеются:
1. Демо-версия [6]
2. Претренерованная модель на 800гб: Hunyuan-Large pre-trained model [7]
3. Инструкт модель на 800гб: Hunyuan-Large-Instruct [8]
4. Инструкт модель на 400гб: Hunyuan-Large-Instruct-FP8 [9]
Пара бенчмарков:
Hunyuan-Large pre-trained model
Hunyuan-Large-Instruct
Автор: DZRobo
Источник [10]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/10687
URLs in this post:
[1] Недавно вышедшая Hunyuan-Large от Tencent: https://huggingface.co/tencent/Tencent-Hunyuan-Large?text=My+name+is+Merve+and+my+favorite
[2] внимания: http://www.braintools.ru/article/7595
[3] памяти: http://www.braintools.ru/article/4140
[4] обучения: http://www.braintools.ru/article/5125
[5] интеллекта: http://www.braintools.ru/article/7605
[6] Демо-версия: https://huggingface.co/spaces/tencent/Hunyuan-Large
[7] Hunyuan-Large pre-trained model : https://huggingface.co/tencent/Tencent-Hunyuan-Large/tree/main/Hunyuan-A52B-Pretrain
[8] Hunyuan-Large-Instruct : https://huggingface.co/tencent/Tencent-Hunyuan-Large/tree/main/Hunyuan-A52B-Instruct
[9] Hunyuan-Large-Instruct-FP8 : https://huggingface.co/tencent/Tencent-Hunyuan-Large/tree/main/Hunyuan-A52B-Instruct-FP8
[10] Источник: https://habr.com/ru/news/856358/?utm_source=habrahabr&utm_medium=rss&utm_campaign=856358
Нажмите здесь для печати.