Вчера NVIDIA на своей ежегодной конференции GTC представили долгожданные графические процессоры
GeForce RTX 40, которые получили ряд достаточно серьезных технологических инноваций.
Ключевые особенности
- Потоковые мультипроцессоры с шейдерной производительностью до 83 терафлопс — прирост более чем в 2 раза по сравнению с предыдущим поколением.
-
RT-ядра третьего поколения с эффективной производительностью трассировки лучей до 191 терафлопс — в 2,8 раза больше, чем у предыдущего поколения.
-
Тензорные ядра четвертого поколения с производительностью до 1.32 петафлопса при использовании расчетов FP8 — в 5 раз больше, чем у предыдущего поколения.
-
Переупорядочивание выполнения шейдеров (SER), которое повышает эффективность использования графического процессора за счет переупорядочивания затенения в процессе рендеринга. SER - столь же важное нововведение, каким было добавление внеочередного исполнения инструкций для CPU. SER повышает производительность трассировки лучей до 3 раз и частоту кадров в играх до 25%.
-
Ускоритель оптического процессоры потока Ada с удвоенной производительностью позволяет DLSS 3 прогнозировать направление движения в сцене, позволяя нейронной сети повышать частоту кадров при сохранении качества изображения.
-
Архитектурные усовершенствования, тесно связанные с оптимизированным для NVIDIA технологическим процессом TSMC 4N, приводят к двукратному скачку энергоэффективности.
-
Два кодировщика NVIDIA (NVENC) сокращают время экспорта видео вдвое и поддерживают кодирование AV1. Кодировщики NVENC AV1 используются в OBS, Blackmagic Design DaVinci Resolve, Discord и других приложениях.
Кратко о преимуществах нового флагмана RTX 4090 24ГБ:
- Это самый быстрый в мире графический процессор для игр и творчества с потрясающей энергоэффективностью, акустическими и температурными характеристиками.
-
До 4 раз быстрее с новой версией DLSS 3 по сравнению с DLSS 2 на RTX 3090 Ti в играх с трассировкой лучей.
-
До 2 раз быстрее при сохранении того же энергопотребления 450 Вт в современных играх.
-
Стабильно обеспечивает около 100 кадров в секунду в играх с разрешением 4K.
-
На борту RTX 4090 76 миллиардов транзисторов, 16 384 ядер CUDA и 24 ГБ высокоскоростной памяти GDDR6X.
Кратко о преимуществах RTX 4080 16 ГБ:
- RTX 4080 16 ГБ имеет 9728 ядер CUDA и 16 ГБ высокоскоростной памяти GDDR6X
-
До 2х раз быстрее в современных играх, чем GeForce RTX 3080 Ti
-
RTX 4080 16 ГБ более производительная, чем GeForce RTX 3090 Ti при меньшем энергопотреблении.
Кратко о преимуществах RTX 4080 12 ГБ:
- RTX 4080 12 ГБ имеет 7680 ядер CUDA и 12 ГБ высокоскоростной памяти GDDR6X
-
Быстрее флагмана предыдущего поколения RTX 3090 Ti
Что еще NVIDIA создала для пользователей вместе с выходом GeForce RTX 40?
DLSS 3 создаёт новые кадры для более плавного игрового процесса
NVIDIA DLSS 3 — следующая ступень революционной технологии нейронного рендеринга Deep Learning Super Sampling для игр и творческих приложений. Технология на базе искусственного интеллекта может создавать готовые кадры для значительно более плавного игрового процесса. DLSS 3 способен преодолеть ограничения производительности при упоре в процессор, позволяя графическому процессору самостоятельно создавать новые кадры.
Технология в процессе добавления в самые популярные игровые движки, такие как Unity и Unreal Engine, и получила поддержку ведущих мировых разработчиков игр - скоро будет выпущено более 35 игр и приложений с DLSS 3.
Новые технологии трассировки лучей для большего погружения в игры
На потяжении десятилетий рендеринг сцен с трассировкой лучей с физически корректным освещением в реальном времени считался Святым Граалем графики. В то же время геометрическая сложность сцен и объектов продолжает расти, поскольку создатели игр и графики стремятся обеспечить наиболее точное представление реального мира.
Достижение физически точной графики требует огромной вычислительной мощности. Современные игры с трассировкой лучей, такие как Cyberpunk 2077, выполняют более 600 вычислений трассировки лучей для каждого пикселя только для определения освещения — в 16 раз больше, чем в первых играх с трассировкой лучей, представленных четыре года назад.
Новые RT-ядра третьего поколения были улучшены, чтобы ускорить тестирование пересечения лучей и треугольников в 2 раза, и включают в себя два важных новых аппаратных блока. Opacity Micromap Engine в 2 раза ускоряет трассировку геометрии с тестом прозрачности, а Micro-Mesh Engine создает микросетки на лету для рендеринга дополнительной геометрии. Micro-Mesh Engine обеспечивает преимущества повышенной геометрической сложности без традиционных затрат на обработку и хранение сложной геометрии.
Новый взгляд на творчество с RTX Remix и новыми кодировщиками AV1
Графические процессоры GeForce RTX 40 и DLSS 3 обеспечивают преимущества для творчества с NVIDIA Studio. 3D-художники могут визуализировать сцены с полной трассировкой лучей с точной физикой и реалистичными материалами и просматривать изменения в реальном времени без прокси.
Монтаж видео и стримы также ускоряются благодаря улучшенной производительности графического процессора и включению двух новых кодировщиков AV1 восьмого поколения. Набор средств разработки программного обеспечения NVIDIA Broadcast содержит три обновления, которые теперь доступны для партнеров, включая оценку выражения лица, обеспечение зрительного контакта и улучшение качества виртуального фона.
NVIDIA Omniverse, входящая в комплект программного обеспечения NVIDIA Studio, скоро получит дополнение NVIDIA RTX Remix, платформу для моддинга, позволяющую создавать потрясающие RTX-ремастеры классических игр. RTX Remix позволяет моддерам легко извлекать игровые ресурсы, автоматически улучшать материалы с помощью мощных инструментов искусственного интеллекта и быстро включать поддержку RTX с трассировкой лучей и DLSS.