Tesla V100技术架构白皮书
- 格式:docx
- 大小:12.25 MB
- 文档页数:59
NVIDIA TESLA V100 GPU
GPU
AI HPC
NVIDIA Tesla V100 GPU ................................................................................................. 1 Tesla V100 AI
HPC (2)
(2)
(5)
NVIDIA GPU 6
(6)
GPU (7)
GV100 GPU (8)
(11)
Volta ................................................................................................................................ 12 Tensor .......................................................................................................................... 14 L1 (17)
FP32
INT32 (18)
(18)
NVLink (19)
(19)
(20)
HBM2 ............................................................................................................................... 22 ECC (23)
(23)
Tesla V100 ........................................................................................................................ 24 GV100 CUDA .. (26)
(27)
NVIDIA
GPU SIMT (27)
Volta SIMT (28)
(30)
VOLTA (31)
(33)
(34)
........................................................................................................................... 37 Tesla V100
NVIDIA DGX-1 (38)
NVIDIA DGX-1 .................................................................................................................. 39 DGX-1 .............................................................................................................................. 40 NVIDIA DGX
-
AI (42)
(44)
.................................................................................................................. 44 .. (45)
(45)
NVIDIA GPU (48)
(49)
...................................................................................... 50 (51)
............................................................................................................. 52 .. (53)
(54)
A
B AI C
GPU
84 SM
Volta GV100 GPU NVIDIA Tesla V100 SXM2 (1)
2. Tesla V100 ................................................................................................... 4 Tensor
Tesla V100 (5)
Volta GV100 GPU (9)
5. Volta GV100 (SM) (13)
6. cuBLAS (FP32) (14)
7. cuBLAS FP16
FP32 (15)
8. Tensor
4x4 (15)
9. Tensor ........................................................................................................ 16 10. Pascal Volta 4x4 ...................................................................................... 16 11. Pascal Volta .. (17)
V100
DGX-1”
NVLink ...................................... 20 13. V100 NVLink
GPU
GPU
GPU
CPU (21)
NVLink ............................................................................................. 21 15. V100
HBM2
P100 (22)
16. Tesla V100 .................................................................................................. 24 17. Tesla V100 .................................................................................................. 24 18. NVIDIA Tesla V100 SXM2 - . (25)
CUDA (26)
20. Pascal
GPU
SIMT (27)
21. Volta .......................................................................................................... 28 22. Volta . (29)
(29)
1. 3. 4.
12. “ 14. 19.
23.