★ 社区积分制度 ★ 新手必读 ★ 申请版主★

电子工程世界-论坛»论坛 › 电子技术交流 › 测评中心专版 › 《大模型时代的基础架构》GPU硬件架构剖析

返回列表发新帖回复

阅 455|回 0

60 帖子	0 TA的资源

一粒金砂（中级）

楼主

发表于2024-9-16 22:45 只看该作者

《大模型时代的基础架构》GPU硬件架构剖析 [复制链接]

邀请：@tagetage @littleshrimp @nmg @freebsder 参与回复

本帖最后由 ltaodream 于 2024-9-16 23:00 编辑

GPU的总体设计

GPU，本质上是一个PCIE插卡/扣卡，由PCB、GPU芯片、GPU内存以及其它附属电路组成。

PCB：印刷电路板
GPU芯片：H100、A100等
GPU芯片：GPU显存

如下图，Nvidia H100的GPU的核心是Nvidia GH100芯片，它对外的接口包括16个PCI-E5.0通道、18个lane通道（NVLink）和6个HBM3/HBM2e通道。

16个PCI-E5.0通道，CPU发送指令，GPU访问主存，可提供63GBps的理论传输带宽。
18个lane通道（NVLink），连接其它GPU，或通过NVLink Switch连接多个GPU，可提供900GBps的理论传输带宽。
6个HBM3/HBM2e通道，单个HBM stack可提供800GBps的理论传输带宽，6个可提供4.8TBps。

f0e62524-96ca-4788-82f1-779a004244f5.png (101.35 KB, 下载次数: 0)

下载附件保存到相册

2024-9-16 22:44 上传

芯片架构剖析

Nvidia H100采用了Nvidia的Hopper架构，除了以上提到的通道，整个GH100上有8个GPC，每4个GPC共用30MB的L2 Cache，每个GPC都有9个TPC，。换句话来说，一颗GH100芯片集成了144个SM。

GPC：GPU处理集群
TPC：纹理处理集群
SM：流式多处理器

每个SM内部有256KB的L1 Cache，4个Tex,4个Tensor Core，128个Cuda Core，Hopper架构还引入了TMA。

Tex：纹理处理单元
Tensor Core：Hopper中是第四代Tensor Core，增加了对Transformer算子的支持
TMA：张量存储器，使用张量维度和块坐标指定数据传输

总结

GPU的发展，就是数据局部性原理的典型体现，将数据尽量放在靠近计算单元的位置，让计算单元尽可能的发挥缓存低延迟、高带宽的优势。

此帖出自测评中心专版论坛

点赞关注

回复

举报

返回列表发新帖回复

开源项目更多>>

随便看看

【MIKROE TFT-PROTO Board测评】显示驱动篇
在广泛收集资料的情况下，对MIKROETFT-PROTOBoard的使用终于有所突破，初步实现了该显示屏的显示驱动。该显示板是使用3.3V电源，其背光LED需要一个5欧的电阻来限流。使用可两个10欧电阻并联得到。该显示板所提供的接口可支持以16位、8位、18位、9位或SPI模式 ...
“我只要你的壳”之TI-82计算器改造(2)
JavaScript -练习册（3）对象
【工程源码】基于FPGA的AHT10温湿度传感器实验
变压器与电感器设计手册（第四版）
输入一个数 x ,按函数 y=x *7 ，输出y ，用汇编编写
求助M3程序下载问题
学习ARM嵌入式方向是什么？

查找数据手册?

EEWorld Datasheet 技术支持

相关文章更多>>

德州仪器 2024年Q4财报解析：中国市场增长亮眼，目前没有收到反垄断调查通知
在 2024 年第四季度收益电话会议上，德州仪器（TI）向外界展示了一些好消息，尤其是凸显了中国市场在其全球布局中的关键地位。第四季度，TI 收入为 40 亿美元，环比下降 3%，比去年同期下
欧盟提议成立高级研究机构：专注于AI等战略技术以加强竞争力
据彭博社报道，欧盟将提议仿照美国政府实体建立一个高级研究项目机构，对战略技术进行投资，以此作为提高欧盟竞争力的更广泛努力的一部分。欧盟还将呼吁为 AI 建设新的超级计算基础设施。知情人士及文件显示
传台积电报废三万片晶圆，三万片受损
晶圆代工龙头厂台积电位于南科的晶圆厂，受地震影响的机台设备移位、晶圆破损经过抢修后，供应链传出，3、 5纳米的先进制程晶圆十八厂，预计将于23日达100%复机，准备恢复正常生产，晶圆十四厂复机还没有
中国芯片出口连续14个月增长
特朗普退出巴黎协定，芯片业碳中和完了没？
汇顶科技 2024 年业绩亮眼，展现强劲发展韧性
谷歌母公司：美国AI难保证对华领先不少方面是落后
消息称三星电子砍半晶圆代工部门 2025 年设备投资预算，陡降至 5 万亿韩元
史上最佳表现：SK 海力士 2024 年营业利润 23.5 万亿韩元
宇树发布“踢足球”机器人G1-Comp，网友：国足有救了

新帖速递

站长推荐

上一条

1/6

下一条

EEWorld订阅号

EEWorld服务号

汽车开发圈

About Us 关于我们客户服务联系方式器件索引网站地图最新更新手机版

站点相关：国产芯安防电子汽车电子手机便携工业控制家用电子医疗电子测试测量网络通信物联网

用户热搜：

北京市海淀区中关村大街18号B座15层1530室电话:(010)82350740 邮编：100190

电子工程世界版权所有京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函

京公网安备 11010802033920号 Copyright © 2005-2025 EEWORLD.com.cn, Inc. All rights reserved

微信扫描

快速回复返回顶部返回列表