NVIDIA L4

Czwarta generacja rdzeni tensorowych Ada Lovelace została zaprojektowana z myślą o akceleracji transformacyjnych technologii AI, takich jak inteligentne chatboty, generatywna AI, przetwarzanie języka naturalnego (NLP), wizja komputerowa i NVIDIA Deep Learning Super Sampling 3.0 (DLSS 3). Rdzenie tensorowe Ada Lovelace uwalniają strukturalną rzadkość macierzy i 8-bitową precyzję liczb zmiennoprzecinkowych (FP8), zapewniając do 4 razy wyższą wydajność wnioskowania w porównaniu z poprzednią generacją ¹. FP8 zmniejsza obciążenie pamięci w porównaniu do większych precyzji i znacznie przyspiesza obliczenia związane ze sztuczną inteligencją.

Rdzenie RT trzeciej generacji Ada Lovelace charakteryzują się dwukrotnie wyższą szybkością analizy przecięć trójkątów siatek modeli w scenie, ponad dwukrotnie zwiększając wydajność renderingu ze śledzeniem promieni. NVIDIA Shader Execution Reordering (SER) zwiększa wydajność ponad 3-krotnie, umożliwiając głębokie, immersyjne wrażenia w wirtualnym świecie i bezprecedensowy wzrost produktywności w grafice i grach wykorzystujących sztuczną inteligencję.

Zaawansowana akceleracja wideo z wykorzystaniem sztucznej inteligencji
Dzięki zoptymalizowanemu stosowi formatu AV1, NVIDIA L4 przenosi akcelerację wideo i sztucznej inteligencji na wyższy poziom, tworząc szeroki wachlarz nowych przypadków użycia, takich jak transkodowanie wideo w czasie rzeczywistym, strumieniowanie, wideokonferencje, rzeczywistość rozszerzona (AR), rzeczywistość wirtualna (VR) i sztuczna inteligencja. Dzięki czterem dekoderom wideo i dwóm koderom wideo, w połączeniu z formatem kompresji AV1, serwery L4 mogą obsługiwać ponad 1000² jednoczesnych strumieni wideo i ponad 120-krotnie większą wydajność potoku wideo AI end-to-end niż rozwiązania CPU³. Co więcej, cztery dekodery JPEG dodatkowo przyspieszają działanie aplikacji, które wymagają mocy obliczeniowej w zakresie wizji komputerowej.

FP8 na L4 w porównaniu do FP16 na T4.
Kodowanie o niskim opóźnieniu P1 na 8x L4 AV1 przy 720p30
Porównanie wydajności serwera z 8x L4 versus serwer CPU 2S Intel 8362: kompleksowy potok wideo z przetwarzaniem wstępnym i końcowym z CV-CUDA, dekodowaniem, wnioskowaniem (SegFormer), kodowaniem, TRT 8.6 versus potok tylko CPU przy użyciu OpenCV.

	Cechy GPU	NVIDIA L4
	Liczba rdzeni CUDA	7680
	Liczba rdzeni tensorowych	240
	Liczba rdzeni RT	60
	Pamięć GPU \| Szyna pamięci	24 GB GDDR6 z ECC \| 192-bit
	Szczytowa wydajność FP32	30,3 TFLOPS
	Szczytowa wydajność RT	? TFLOPS
	Szczytowa wydajność TF32	120 (sparsity) TFLOPS
	Wyjścia na wyświetlacze	– \| tylko vGPU
	Maks. pobór mocy	72 W
	Szyna systemowa	PCIe Gen 4.0
	Form Factor	HHHL, zajmuje 1 slot PCIe
	Chłodzenie	Pasywne
	NVENC \| NVDEC \| JPEG ^dekoder	2 \| 4 \| 4
	Wsparcie dla virtual GPU (vWS)	Tak

SKU: TCSL4PCIE-PB
EAN: 3536403393533

Zawartość:

Karta NVIDIA L4 PCIe

Informacja