Google Cloud и NVIDIA сотрудничают для внедрения возможностей агентского ИИ в локальных средах. Это позволит предприятиям со строгими требованиями к безопасности использовать модели Google Gemini, сохраняя при этом суверенитет данных и соответствие требованиям безопасности.

Для предприятий, работающих в соответствии со строгими нормативными требованиями или требованиями к суверенитету данных, например, для сферы здравоохранения, финансов и государственного управления, это объявление имеет большое значение. До сих пор эти организации не могли использовать все возможности агентного ИИ от ведущих лабораторий из-за моделей развертывания только в облаке и соображений безопасности.
С помощью систем NVIDIA Blackwell HGX и DGX, работающих с Gemini за собственными брандмауэрами, компании теперь могут создавать ИИ-агентов, которые не только понимают, но и рассуждают, действуют и адаптируются — и всё это без ущерба для конфиденциальности или соответствия требованиям.
Ключевую роль здесь играет стек конфиденциальных вычислений NVIDIA. Он шифрует как запросы, отправляемые моделям Gemini, так и конфиденциальные данные, используемые при тонкой настройке, защищая их от посторонних глаз — даже от самого поставщика облачных услуг. Как выразился Сачин Гупта, вице-президент по инфраструктуре в Google Cloud, речь идёт о «безопасных инновациях без ущерба для производительности или простоты эксплуатации».
Однако дело не только в защите логического вывода. Речь также идёт о готовности инфраструктуры. Google Cloud выпустил несколько обновлений для Google Kubernetes Engine (GKE), разработанных специально для поддержки крупномасштабных рабочих нагрузок ИИ.
Новый кластерный директор GKE (ранее Hypercompute Cluster) позволяет использовать массивные кластеры графических процессоров и TPU в качестве отдельных вычислительных единиц, а GKE Inference Gateway обеспечивает интеллектуальную маршрутизацию и балансировку нагрузки для сокращения задержек и затрат. Он тесно интегрируется с NVIDIA Triton и NeMo Guardrails для обеспечения безопасности и управления использованием моделей.
Системы ИИ, которые отличаются от традиционных моделей способностью принимать автономные решения и выполнять многоэтапные задачи, способствуют развитию приложений нового поколения в различных отраслях. Например, финансовые инструменты, которые заблаговременно предотвращают мошенничество, или агенты службы поддержки клиентов, которые выявляют и решают проблемы без участия человека.
Google также инвестирует в инструменты мониторинга и масштабирования для агентского ИИ. Компания объявила о планах по интеграции NVIDIA Dynamo — библиотеки с открытым исходным кодом для масштабирования моделей машинного обучения — и сообщила, что RayTurbo — оптимизированная версия фреймворка Ray, разработанная совместно с Anyscale, появится в GKE в этом году для более быстрых и эффективных конвейеров ИИ.
Для предприятий, которые хотят внедрять агентные приложения ИИ, сохраняя при этом строгий контроль над конфиденциальными данными, это сотрудничество означает, что им больше не придётся выбирать между расширенными возможностями ИИ и соблюдением нормативных требований. Теперь они могут использовать ведущие мультимодальные модели Gemini от Google и оптимизированные по производительности чипы ИИ от NVIDIA, сохраняя при этом локальность, безопасность и соответствие требованиям.
Автор: mefdayy