Компания NVIDIA представила свой новый «суперчип» RTX Spark, который обещает объединить высокопроизводительную обработку ИИ непосредственно на устройстве с графикой AAA-класса для геймеров, работая на платформе Windows на Arm.
Этот чип должен дебютировать в ряде премиальных ноутбуков на базе Windows уже в этом году. Среди первых производителей, анонсировавших модели с RTX Spark, — Microsoft Surface, ASUS, Dell, HP, Lenovo и MSI. Системы на базе RTX Spark будут представлены в различных форматах: от тонких и легких ноутбуков для создателей контента с экраном 35,6 см до более крупных рабочих станций с диагональю 40,6 см и мини-настольных ПК. Все они построены на единой архитектуре памяти и используют технологию графического процессора Blackwell.
В обзоре отмечается, что хотя повседневная производительность и время автономной работы ПК на базе Snapdragon X были исключительными, обещания революционного локального ИИ пока не оправдались. Запуск передовых моделей практически невозможен при объеме оперативной памяти всего 16 ГБ и отсутствии подходящего ускорителя.
RTX Spark значительно отличается от существующих решений, предлагая внушительные 128 ГБ унифицированной системной памяти в сочетании с графическим процессором Blackwell и Arm-процессором Grace, разработанным специально для задач ИИ. Ожидается, что его стоимость будет высокой на текущем рынке с ограниченным предложением памяти. Далее представлен подробный обзор характеристик, которые NVIDIA внедрила в RTX Spark.
Процессор мобильного класса с повышенной производительностью
Анализ процессорной части суперчипа проливает свет на его происхождение. RTX Spark работает на базе NVIDIA N1X, также известного как GB10 Grace Blackwell Superchip. Этот GB10 уже используется в NVIDIA DGX Spark, стоимость которого составляет порядка 4700 долларов США (на момент выхода новости) и который работает под управлением NVIDIA DGX Linux, а не Windows.
GB10 применяет современный дизайн Armv9 — ту же архитектуру, что и в высокопроизводительных чипсетах для смартфонов, что должно обеспечить высокую повседневную производительность. Чип состоит из 10 ядер Arm Cortex-X925 и 10 ядер A725, что в сумме составляет 20 процессорных ядер. Ядра X925 были представлены в 2024 году и использовались в прошлогоднем MediaTek Dimensity 9400 для смартфонов, хотя и в конфигурации с одним «большим» ядром. Примечательно, что MediaTek помогла NVIDIA в разработке процессора для RTX Spark, что объясняет некоторые сходства. По сути, RTX Spark использует ту же процессорную технологию Arm, что и флагманские смартфоны.
Однако RTX Spark имеет не только десять мощных и десять производительных ядер (значительно больше, чем у типичного смартфона), но также работает с частотой 4,0 ГГц для X925 и 2,85 ГГц для A725, обеспечивая повышение производительности на ядро по сравнению с реализациями предыдущего поколения в смартфонах. GB10 имеет схожую с Dimensity конфигурацию кеш-памяти: до 2 МБ L2 для X925 и 512 КБ L2 для A725, в сочетании с 16 МБ L3 и 16 МБ системного кеша. Хотя он может не сравниться с топовыми решениями Apple Silicon или Qualcomm Oryon в однопоточных задачах, его 20-ядерная конфигурация должна обеспечить существенную производительность процессора.
Унифицированная ОЗУ для локального ИИ
Возможно, более важной технологией серверного класса, включенной NVIDIA в RTX Spark, является межсоединение NVLink-C2C. Это соединение памяти обеспечивает двунаправленную пропускную способность до 600 ГБ/с между центральным и графическим процессорами, позволяя им совместно использовать единое адресное пространство практически без накладных расходов. Такой подход к общей памяти уже наблюдается в смартфонах. Современные SoC (системы на кристалле) смартфонов все чаще полагаются на большие общие кеши для эффективного обеспечения данными CPU, GPU и задач ИИ, а также на единый пул LPDDR5X, используемый приложениями, играми и локальными моделями ИИ, такими как Gemini Nano* от Google*.
Совместное использование 128 ГБ памяти между CPU и GPU является ключевым для быстрой работы ИИ на устройстве. NVIDIA отмечает, что ее межсоединение примерно в 5 раз быстрее двунаправленной пропускной способности PCIe Gen5, что может быть заметным «узким местом», если крупные модели ИИ необходимо разделять между системной и графической памятью. Однако выбранная NVIDIA оперативная память LPDDR5X имеет эффективную пропускную способность 273 ГБ/с, что значительно медленнее, чем примерно 768 ГБ/с, характерные для видеокарт с выделенной памятью GDDR6/7. Поэтому не ожидается, что RTX Spark обеспечит игровую производительность на уровне самых топовых десктопных видеокарт.
Тем не менее, NVLink-C2C позволяет CPU и GPU совместно использовать большой пул памяти LPDDR5X на уровне пакета в 128 ГБ для приложений, графики и задач ИИ, требующих экстремальной производительности памяти. NVIDIA утверждает, что 128 ГБ унифицированной памяти достаточно для хранения модели ИИ со 120 миллиардами параметров. Для сравнения, GPT-OSS 120B занимает около 80 ГБ, а NVIDIA Nemotron 3 Super — 83 ГБ. Мобильные ИИ-модели Google* на устройстве занимают менее 4 ГБ ОЗУ, что демонстрирует, насколько больше памяти требуется для перехода от «карманного» к ИИ серверного класса.
Новый подход к работе на ноутбуках
Для обработки таких задач ИИ требуется специализированный процессорный блок. Именно здесь RTX Spark стремится выделиться: он оснащен интегрированным графическим процессором Blackwell — той же архитектурой, которая используется в игровых видеокартах NVIDIA 5000-й серии. Графический процессор внутри RTX Spark имеет 6144 ядра CUDA, что на бумаге соответствует GeForce RTX 5070. Однако значительно более низкая пропускная способность памяти и гораздо более жесткие ограничения по энергопотреблению означают, что игровая производительность, скорее всего, будет значительно ниже, чем у настольного RTX 5070. Тем не менее, он поддерживает DLSS 4.5, Reflex и аппаратную трассировку лучей, предлагая многие из тех же функций, что и настольные игровые видеокарты NVIDIA.
Хотя игры будут возможны, этот графический процессор разработан для того, чтобы предоставить экосистему ИИ CUDA и TensorRT в распоряжение обычных пользователей. NVIDIA заявляет о производительности ИИ до 1 петафлопса (квадриллиона операций с плавающей запятой в секунду) в режиме FP4, с целью запуска больших квантованных моделей непосредственно из 128 ГБ унифицированной памяти на этих ядрах CUDA. Для очень крупных моделей, которые превышают обычные пределы памяти графического процессора, 128 ГБ унифицированной памяти RTX Spark будут более практичными, чем полагаться на более быстрый графический процессор всего с 16 ГБ или 32 ГБ видеопамяти.
NVIDIA идет по тому же пути, что и Apple Silicon: большая унифицированная память, Arm-процессоры и тесно интегрированный графический процессор. Во многих отношениях RTX Spark представляет собой слияние двух миров вычислений. Его эффективная, но мощная архитектура Arm CPU, конструкция унифицированной памяти и энергоэффективная упаковка заимствуют многие идеи, которые уже изменили смартфоны и Mac на базе Apple Silicon. При этом NVIDIA сочетает эти концепции с графическим процессором Blackwell, ускорением CUDA и необычайно большим объемом памяти, предназначенным для локального вывода ИИ и рабочих нагрузок серверного уровня.
Успех этого перехода к рабочим станциям, ориентированным на ИИ, будет зависеть от цены. Хотя стоимость первой волны ноутбуков, запускаемых этой осенью, пока неизвестна, существующая настольная версия DGX Linux указывает на то, что цены будут весьма высокими. Тем не менее, платформа выглядит многообещающей для той небольшой, но растущей части пользователей Windows, стремящихся запускать свои собственные высокопроизводительные задачи ИИ.
* — деятельность компании запрещена на территории РФ
Womenis.ru Для современной Женщины с большой буквы