01Введение
Персональные ИИ-агенты набирают популярность: open-source проекты, такие как OpenClaw и Hermes, быстро распространяются в сообществах разработчиков на GitHub. Такие агенты адаптируются к индивидуальным предпочтениям и рабочим процессам, могут взаимодействовать с приложениями, генерировать контент, автоматизировать повторяющиеся задачи и управлять многошаговыми операциями — и всё это локально на устройстве.
На выставке NVIDIA GTC Taipei в рамках COMPUTEX компания представила NVIDIA RTX Spark — новый класс Windows-ПК, созданный специально для персональных агентов, а также ряд обновлений, расширяющих возможности локальных агентов в экосистемах NVIDIA RTX и DGX.
02RTX Spark: ПК для агентов
Для безопасной и приватной работы агентов требуется соответствующее оборудование. RTX Spark обладает производительностью до 1 петафлопса для ИИ и 128 ГБ унифицированной памяти, что позволяет справляться с вычислительными нагрузками локальных агентов. Этот новый класс компьютеров превращает инструмент в помощника.
Разработанный для ИИ, творчества и игр, RTX Spark объединяет 30-летний опыт NVIDIA в области технологий в тонких ноутбуках на Windows с длительным временем автономной работы и ультраэффективных настольных ПК.
03Партнёрство с Microsoft и безопасность агентов
Широкое внедрение агентов сдерживалось невозможностью запускать их безопасно и приватно на основных ПК пользователей. NVIDIA и Microsoft совместно решают эту задачу, создавая надёжную и безопасную платформу Windows для локальных агентов.
Новые примитивы безопасности Windows и среда выполнения NVIDIA OpenShell обеспечивают идентификацию, изоляцию, политики и сквозную безопасность для агентов. OpenShell добавляет возможности для определения пользователем, что агент может и не может делать, интеллектуальной маршрутизации запросов к локальным моделям в соответствии с политиками конфиденциальности и маскировки личной информации в запросах к облачным моделям.
Эти механизмы уже внедряются ведущими разработчиками агентов, такими как Hermes Agent и OpenClaw, в их новые приложения для Windows.
04Производительность и оптимизации
NVIDIA сотрудничает с сообществом llama.cpp, внедряя такие функции, как multi-token prediction (MTP) — спекулятивное декодирование, при котором маленькая модель-черновик предлагает несколько токенов за раз, а целевая модель проверяет их за один проход. В сочетании с другими оптимизациями это даёт двукратный прирост производительности на Qwen 3.6 и 3.5 27B и 1,6-кратный на Qwen 3.6 и 3.5 35B.
Для энтузиастов с multi-GPU конфигурациями:
- llama.cpp добавляет тензорный параллелизм, обеспечивая до 2x памяти и 1,8x производительности на двух одинаковых GPU.
- ComfyUI получает новый метод classifier-free guidance для двукратного прироста производительности на двух одинаковых GPU, а также возможность разделять цепочки моделей между GPU для использования объединённой памяти.
05Агенты на Linux: DGX Spark
Для разработчиков, которым нужны постоянно доступные локальные агенты, NVIDIA DGX Spark — самый производительный персональный ИИ-компьютер для агентов в среде Linux. Он объединяет большой объём памяти, высокую производительность и совместимость с экосистемой CUDA.
Последний релиз DGX Spark OS включает упрощённый установщик NemoClaw и более быстрый инференс на топовых агентных моделях. NemoClaw теперь доступен для всех ПК NVIDIA RTX и DGX на Linux и Windows Subsystem for Linux.
NVIDIA также сотрудничает с vLLM для оптимизации инференса агентов: новые оптимизации и чекпоинты NVFP4 для Qwen 3.6 35B обеспечивают 2,6-кратную производительность на DGX Spark по сравнению с предыдущими чекпоинтами.
06Творческие возможности с Adobe
NVIDIA и Adobe перерабатывают Adobe Premiere и Photoshop для RTX Spark. Firefly-функции Generative Fill в Photoshop и Generative Extend в Premiere — среди сотен ускоренных инструментов, которые теперь работают до 2x быстрее на RTX Spark.
Adobe Premiere получит новый видеоконвейер, использующий унифицированную память RTX Spark, GPU Blackwell и TensorRT, обеспечивая работу в реальном времени при монтаже и цветокоррекции. Substance 3D Painter и Stager будут работать нативно на RTX Spark.
Новый движок Photoshop будет оптимизирован для GPU-ускоренного композитинга, поддерживая живые фильтры, HDR и современное рисование. Adobe также расширит Premiere и Photoshop для работы с Windows-агентами.
07Новые инструменты и обновления для создателей
- NVIDIA Broadcast 2.2: Studio Voice выходит из бета-версии, работает на GeForce RTX 3060 и выше, добавлена интеграция с Elgato Stream Deck и настраиваемые горячие клавиши.
- Project G-Assist: поддержка Stream Deck через Elgato MCP Server.
- Blender Cycles: интеграция DLSS 4.5 Ray Reconstruction в качестве нового денойзера, что превращает viewport в интерактивный просмотрщик с качеством, близким к финальному рендеру. Обновление выйдет с Blender 5.3 этой осенью.
- RTX Video Frame Generation: новый ИИ-эффект, удваивающий или учетверяющий частоту кадров видео в реальном времени. Доступен как Python wheel и узел ComfyUI.
08Агенты с H Company
H Company выпускает инструменты для управления компьютером — новые модели и готовящееся десктопное приложение для агентов, оптимизированные для ПК RTX и DGX. Совместно с NVIDIA выполнена квантизация моделей Holo Computer Use и ускорение обвязки, что даёт двукратное ускорение на GPU NVIDIA при снижении потребления памяти на 35%.
Перевод и редакционная адаптация AIDF
Материал основан только на фактах из оригинальной публикации
Источник: NVIDIA Levels Up Local AI Agents Across RTX PCs and DGX Spark - NVIDIA Blog
