NVIDIA Ada Lovelace 아키텍처

뛰어난 게이밍과 크리에이티브, 전문 그래픽, AI, 컴퓨팅 성능을 제공하도록 설계되었습니다.

3D 그래픽을 위한 획기적인 순간.

Ada GPU 아키텍처는 레이 트레이싱 및 AI 기반 뉴럴 그래픽을 위한 혁신적인 성능을 제공하도록 설계되었습니다. GPU 성능의 기준선을 대폭 높여 레이 트레이싱과 뉴럴 그래픽의 변곡점이 됩니다.

4세대 Tensor 코어

NVIDIA Tensor 코어NVIDIA DLSS와 NVIDIA DLSS 3의 곱절에 해당하는 새로운 프레임 레이트를 포함한 혁신적인 AI 기술을 지원 및 가속화합니다.

Ada의 새로운 4세대 Tensor 코어는 믿을 수 없을 정도로 속도가 빨라 Hopper H100 데이터센터 GPU에 처음 도입된 새로운 FP8 트랜스포머 엔진을 사용하여 1.4 Tensor-petaFLOPS까지 처리량을 최대 5배 높입니다.

NVIDIA Tensor 코어
NVIDIA 3세대 RT 코어

3세대 RT 코어

NVIDIA는 성능 집약적인 레이 트레이싱 워크로드를 처리하도록 특별히 설계한 GPU 내 전문 프로세싱 코어인 레이 트레이싱 코어(RT 코어)를 발명하여 실시간 레이 트레이싱을 현실로 만들었습니다. 

Ada의 3세대 RT 코어는 2배의 레이 트라이앵글 교차 처리량을 제공하여 RT-TFLOP 성능을 2배 이상 높입니다.

새로운 RT 코어에는 새로운 불투명도 마이크로맵(OMM) 엔진과 새로운 변위 마이크로 메쉬(DMM) 엔진도 포함되어 있습니다. OMM 엔진을 사용하면 나뭇잎, 입자 및 울타리에 자주 사용되는 알파 테스트 텍스처의 레이 트레이싱 속도가 훨씬 더 빨라집니다. DMM 엔진은 최대 20배 적은 바운딩 볼륨 계층 구조(BVH) 스토리지 공간으로 최대 10배 빠른 BVH 빌드 시간을 제공하여 기하학적으로 복잡한 장면의 실시간 레이 트레이싱을 지원합니다.

쉐이더 실행 재배치

고급 레이 트레이싱에는 장면 전체에서 수많은 광선이 수없이 다양한 재료 유형에 부딪히는 영향을 계산하여 쉐이더에 대해 갈라지는 비효율적인 순차적 워크로드를 만들어내야 합니다(쉐이더는 3D 장면을 렌더링하는 동안 적절한 수준의 빛, 어둠 및 색상을 계산하는 장치로 모든 최신 게임에 사용됩니다).

쉐이더 실행 재배치(SER) 기술은 이전에 비효율적이었던 워크로드를 훨씬 더 효율적인 워크로드로 동적으로 재구성합니다. SER은 레이 트레이싱 작업의 쉐이더 성능을 최대 3배, 인게임 프레임 레이트를 최대 25%까지 개선할 수 있습니다.

쉐이더 실행 재배치
NVIDIA Optical Flow Accelerator

DLSS 3

NVIDIA DLSS 3은 성능을 크게 향상시키는 AI 기반 그래픽의 혁신입니다. DLSS 3은 GeForce RTX 40 시리즈 GPU의 새로운 4세대 Tensor 코어와 Optical Flow Accelerator로 구동되며, AI 기반으로 추가적인 고품질 프레임을 생성합니다.

AV1 인코더

Ada 아키텍처를 기반으로 제작된 그래픽 카드는 AV1 인코딩이 포함된 새로운 8세대 NVIDIA 인코더(NVENC)를 제공하여 스트리머, 방송인 및 영상 통화 발신자에게 다양한 새로운 가능성을 제공합니다.

H.264보다 40% 더 효율적이며 1080p로 스트리밍하는 사용자는 동일한 비트레이트 및 품질로 실행하면서 스트림 해상도를 1440p로 높일 수 있습니다.

AV1 인코딩을 갖춘 NVIDIA 인코더

백서를 통해 자세히 알아보기