- BrainTools - https://www.braintools.ru -

Tencent представила Hunyuan-Large — крупнейшую открытую модель с 389 миллиардами параметров

Недавно вышедшая Hunyuan-Large от Tencent [1], кажется, немного прошла мимо внимания [2] широкой аудитории, а ведь это по-настоящему значимое событие в мире ИИ. На первый взгляд — очередная модель, но на деле — это крупнейшая открытая MoE (Mixture of Experts) модель на основе Transformer с впечатляющими 389 миллиардами параметров и 52 миллиардами активных параметров! Давайте разберёмся, почему это настолько важно и чем Hunyuan-Large может удивить даже искушённых специалистов.

Tencent представила Hunyuan-Large — крупнейшую открытую модель с 389 миллиардами параметров - 1

Основные достоинства модели:

  1. Возможность обработки супер-длинных контекстов — поддержка текстов до 256 тысяч токенов. Это значит, что модель может легко справляться с массивными документами, сохраняя связность и внимание к деталям даже в самых длинных текстах.

  2. Эффективность использования памяти [3] — Hunyuan-Large задействует инновационные методы, такие как сжатие кеша и адаптивные уровни обучения [4] для «экспертов», что позволяет снижать нагрузку на ресурсы и поддерживать высокую производительность.

  3. Точность на уровне лучших — модель уверенно показывает себя на бенчмарках вроде MMLU, CMMLU и других. Она не просто конкурирует, но и превосходит ряд известных моделей в задачах на понимание и анализ текста.

Итак, если вы ещё не обратили внимание на эту модель — самое время присмотреться! Tencent открывает доступ к Hunyuan-Large, приглашая исследователей и разработчиков к сотрудничеству и совместной работе над расширением границ искусственного интеллекта [5]. Ну и ждем 32b, 14b и 7b версии!

На Huggingface имеются:
1. Демо-версия [6]
2. Претренерованная модель на 800гб: Hunyuan-Large pre-trained model [7]
3. Инструкт модель на 800гб: Hunyuan-Large-Instruct [8]
4. Инструкт модель на 400гб: Hunyuan-Large-Instruct-FP8 [9]

Пара бенчмарков:
Hunyuan-Large pre-trained model

Hunyuan-Large pre-trained model

Hunyuan-Large pre-trained model

Hunyuan-Large-Instruct

Hunyuan-Large-Instruct

Hunyuan-Large-Instruct

Автор: DZRobo

Источник [10]


Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/10687

URLs in this post:

[1] Недавно вышедшая Hunyuan-Large от Tencent: https://huggingface.co/tencent/Tencent-Hunyuan-Large?text=My+name+is+Merve+and+my+favorite

[2] внимания: http://www.braintools.ru/article/7595

[3] памяти: http://www.braintools.ru/article/4140

[4] обучения: http://www.braintools.ru/article/5125

[5] интеллекта: http://www.braintools.ru/article/7605

[6] Демо-версия: https://huggingface.co/spaces/tencent/Hunyuan-Large

[7] Hunyuan-Large pre-trained model : https://huggingface.co/tencent/Tencent-Hunyuan-Large/tree/main/Hunyuan-A52B-Pretrain

[8] Hunyuan-Large-Instruct : https://huggingface.co/tencent/Tencent-Hunyuan-Large/tree/main/Hunyuan-A52B-Instruct

[9] Hunyuan-Large-Instruct-FP8 : https://huggingface.co/tencent/Tencent-Hunyuan-Large/tree/main/Hunyuan-A52B-Instruct-FP8

[10] Источник: https://habr.com/ru/news/856358/?utm_source=habrahabr&utm_medium=rss&utm_campaign=856358

www.BrainTools.ru

Рейтинг@Mail.ru
Rambler's Top100