Czwarta generacja rdzeni tensorowych Ada Lovelace została zaprojektowana z myślą o akceleracji transformacyjnych technologii AI, takich jak inteligentne chatboty, generatywna AI, przetwarzanie języka naturalnego (NLP), wizja komputerowa i NVIDIA Deep Learning Super Sampling 3.0 (DLSS 3). Rdzenie tensorowe Ada Lovelace uwalniają strukturalną rzadkość macierzy i 8-bitową precyzję liczb zmiennoprzecinkowych (FP8), zapewniając do 4 razy wyższą wydajność wnioskowania w porównaniu z poprzednią generacją 1. FP8 zmniejsza obciążenie pamięci w porównaniu do większych precyzji i znacznie przyspiesza obliczenia związane ze sztuczną inteligencją.
Rdzenie RT trzeciej generacji Ada Lovelace charakteryzują się dwukrotnie wyższą szybkością analizy przecięć trójkątów siatek modeli w scenie, ponad dwukrotnie zwiększając wydajność renderingu ze śledzeniem promieni. NVIDIA Shader Execution Reordering (SER) zwiększa wydajność ponad 3-krotnie, umożliwiając głębokie, immersyjne wrażenia w wirtualnym świecie i bezprecedensowy wzrost produktywności w grafice i grach wykorzystujących sztuczną inteligencję.
Zaawansowana akceleracja wideo z wykorzystaniem sztucznej inteligencji
Dzięki zoptymalizowanemu stosowi formatu AV1, NVIDIA L4 przenosi akcelerację wideo i sztucznej inteligencji na wyższy poziom, tworząc szeroki wachlarz nowych przypadków użycia, takich jak transkodowanie wideo w czasie rzeczywistym, strumieniowanie, wideokonferencje, rzeczywistość rozszerzona (AR), rzeczywistość wirtualna (VR) i sztuczna inteligencja. Dzięki czterem dekoderom wideo i dwóm koderom wideo, w połączeniu z formatem kompresji AV1, serwery L4 mogą obsługiwać ponad 10002 jednoczesnych strumieni wideo i ponad 120-krotnie większą wydajność potoku wideo AI end-to-end niż rozwiązania CPU3. Co więcej, cztery dekodery JPEG dodatkowo przyspieszają działanie aplikacji, które wymagają mocy obliczeniowej w zakresie wizji komputerowej.
Cechy GPU | NVIDIA L4 | |
---|---|---|
Liczba rdzeni CUDA | 7680 | |
Liczba rdzeni tensorowych | 240 | |
Liczba rdzeni RT | 60 | |
Pamięć GPU | Szyna pamięci | 24 GB GDDR6 z ECC | 192-bit | |
Szczytowa wydajność FP32 | 30,3 TFLOPS | |
Szczytowa wydajność RT | ? TFLOPS | |
Szczytowa wydajność TF32 | 120 (sparsity) TFLOPS | |
Wyjścia na wyświetlacze | – | tylko vGPU | |
Maks. pobór mocy | 72 W | |
Szyna systemowa | PCIe Gen 4.0 | |
Form Factor | HHHL, zajmuje 1 slot PCIe | |
Chłodzenie | Pasywne | |
NVENC | NVDEC | JPEG dekoder | 2 | 4 | 4 | |
Wsparcie dla virtual GPU (vWS) | Tak |
SKU: TCSL4PCIE-PB
EAN: 3536403393533
Zawartość: