NVIDIA L4

Czwarta generacja rdzeni tensorowych Ada Lovelace została zaprojektowana z myślą o akceleracji transformacyjnych technologii AI, takich jak inteligentne chatboty, generatywna AI, przetwarzanie języka naturalnego (NLP), wizja komputerowa i NVIDIA Deep Learning Super Sampling 3.0 (DLSS 3). Rdzenie tensorowe Ada Lovelace uwalniają strukturalną rzadkość macierzy i 8-bitową precyzję liczb zmiennoprzecinkowych (FP8), zapewniając do 4 razy wyższą wydajność wnioskowania w porównaniu z poprzednią generacją 1. FP8 zmniejsza obciążenie pamięci w porównaniu do większych precyzji i znacznie przyspiesza obliczenia związane ze sztuczną inteligencją.

Rdzenie RT trzeciej generacji Ada Lovelace charakteryzują się dwukrotnie wyższą szybkością analizy przecięć trójkątów siatek modeli w scenie, ponad dwukrotnie zwiększając wydajność renderingu ze śledzeniem promieni. NVIDIA Shader Execution Reordering (SER) zwiększa wydajność ponad 3-krotnie, umożliwiając głębokie, immersyjne wrażenia w wirtualnym świecie i bezprecedensowy wzrost produktywności w grafice i grach wykorzystujących sztuczną inteligencję.

Zaawansowana akceleracja wideo z wykorzystaniem sztucznej inteligencji
Dzięki zoptymalizowanemu stosowi formatu AV1, NVIDIA L4 przenosi akcelerację wideo i sztucznej inteligencji na wyższy poziom, tworząc szeroki wachlarz nowych przypadków użycia, takich jak transkodowanie wideo w czasie rzeczywistym, strumieniowanie, wideokonferencje, rzeczywistość rozszerzona (AR), rzeczywistość wirtualna (VR) i sztuczna inteligencja. Dzięki czterem dekoderom wideo i dwóm koderom wideo, w połączeniu z formatem kompresji AV1, serwery L4 mogą obsługiwać ponad 10002 jednoczesnych strumieni wideo i ponad 120-krotnie większą wydajność potoku wideo AI end-to-end niż rozwiązania CPU3. Co więcej, cztery dekodery JPEG dodatkowo przyspieszają działanie aplikacji, które wymagają mocy obliczeniowej w zakresie wizji komputerowej.

  1. FP8 na L4 w porównaniu do FP16 na T4.
  2. Kodowanie o niskim opóźnieniu P1 na 8x L4 AV1  przy 720p30
  3. Porównanie wydajności serwera z 8x L4 versus serwer CPU 2S Intel 8362: kompleksowy potok wideo z przetwarzaniem wstępnym i końcowym z CV-CUDA, dekodowaniem, wnioskowaniem (SegFormer), kodowaniem, TRT 8.6 versus potok tylko CPU przy użyciu OpenCV.
Cechy GPU NVIDIA L4
Liczba rdzeni CUDA 7680
Liczba rdzeni tensorowych 240
Liczba rdzeni RT 60
Pamięć GPU | Szyna pamięci 24 GB GDDR6 z ECC | 192-bit
Szczytowa wydajność FP32 30,3 TFLOPS
Szczytowa wydajność RT  ? TFLOPS
Szczytowa wydajność TF32 120 (sparsity) TFLOPS
Wyjścia na wyświetlacze – | tylko vGPU
Maks. pobór mocy 72 W
Szyna systemowa PCIe Gen 4.0
Form Factor HHHL, zajmuje 1 slot PCIe
Chłodzenie Pasywne
NVENC | NVDEC | JPEG dekoder 2 | 4 | 4
Wsparcie dla virtual GPU (vWS) Tak

 

SKU: TCSL4PCIE-PB
EAN: 3536403393533

Zawartość: 

  • Karta NVIDIA L4 PCIe
Udostępnij na Facebook
WordPress Appliance - Powered by TurnKey Linux