Tesla V100技术架构白皮书

  • 格式:docx
  • 大小:12.25 MB
  • 文档页数:59

下载文档原格式

  / 15
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

NVIDIA TESLA V100 GPU

GPU

AI HPC

NVIDIA Tesla V100 GPU ................................................................................................. 1 Tesla V100 AI

HPC (2)

(2)

(5)

NVIDIA GPU 6

(6)

GPU (7)

GV100 GPU (8)

(11)

Volta ................................................................................................................................ 12 Tensor .......................................................................................................................... 14 L1 (17)

FP32

INT32 (18)

(18)

NVLink (19)

(19)

(20)

HBM2 ............................................................................................................................... 22 ECC (23)

(23)

Tesla V100 ........................................................................................................................ 24 GV100 CUDA .. (26)

(27)

NVIDIA

GPU SIMT (27)

Volta SIMT (28)

(30)

VOLTA (31)

(33)

(34)

........................................................................................................................... 37 Tesla V100

NVIDIA DGX-1 (38)

NVIDIA DGX-1 .................................................................................................................. 39 DGX-1 .............................................................................................................................. 40 NVIDIA DGX

-

AI (42)

(44)

.................................................................................................................. 44 .. (45)

(45)

NVIDIA GPU (48)

(49)

...................................................................................... 50 (51)

............................................................................................................. 52 .. (53)

(54)

A

B AI C

GPU

84 SM

Volta GV100 GPU NVIDIA Tesla V100 SXM2 (1)

2. Tesla V100 ................................................................................................... 4 Tensor

Tesla V100 (5)

Volta GV100 GPU (9)

5. Volta GV100 (SM) (13)

6. cuBLAS (FP32) (14)

7. cuBLAS FP16

FP32 (15)

8. Tensor

4x4 (15)

9. Tensor ........................................................................................................ 16 10. Pascal Volta 4x4 ...................................................................................... 16 11. Pascal Volta .. (17)

V100

DGX-1”

NVLink ...................................... 20 13. V100 NVLink

GPU

GPU

GPU

CPU (21)

NVLink ............................................................................................. 21 15. V100

HBM2

P100 (22)

16. Tesla V100 .................................................................................................. 24 17. Tesla V100 .................................................................................................. 24 18. NVIDIA Tesla V100 SXM2 - . (25)

CUDA (26)

20. Pascal

GPU

SIMT (27)

21. Volta .......................................................................................................... 28 22. Volta . (29)

(29)

1. 3. 4.

12. “ 14. 19.

23.