电子工程世界-论坛»论坛 › 电子技术交流 › 测评中心专版 › 《大模型时代的基础架构》软件程序与专用硬件的结合

阅 365|回 0

60 帖子	0 TA的资源

一粒金砂（中级）

楼主

发表于2024-9-16 23:00 只看该作者

《大模型时代的基础架构》软件程序与专用硬件的结合 [复制链接]

邀请：@tagetage @littleshrimp @nmg @okhxyyo 参与回复

GPU并行计算库

第二章比较了C语言和GPU实现向量加法代码的区别，来体现在GPU上运行的CUDA是一个原生为并行计算设计的框架。

CUDA向开发者屏蔽了内存数据传输到方式，在libcudart.so等动态链接库中调用了GPU的KMD来让GPU执行计算。

KMD：Kernel Mode Driver，内核模式驱动

分布式AI训练

模型并行策略：将模型部署到很多设备上，由于显存限制，当模型很大的时候，单个模型难以跑在单个GPU。
数据并行策略：多个GPU上放置相同模型，各个GPU采用不同的数据进行训练。

总结

希望可以对大家去学习CUDA和TensorFlow的原理起到抛砖引玉的效果。深入AI，学习原理必不可少。

此帖出自测评中心专版论坛

点赞关注

返回列表发新帖回复

活动更多>>

开源项目更多>>

随便看看

《深度学习的数学——使用Python语言》10.全连接网络的反向传播
基于书中第十章，本节中，我们将深入学习反向传播的原理，并通过MNIST手写数字识别任务，结合PyTorch代码实现，手动编写反向传播逻辑，从而加深对于反向传播内部机制的理解。神经网络与反向传播的基本概念神经网络是一种由多层神经元组成的计算模型，每一层神 ...
《ROS2智能机器人开发实践》--1.开箱与全书概览
《Linux内核深度解析》-系统调用学习
WIN 10 PH2303
平头哥RVB2601创意应用开发】@fxyc87 RVB2601-奇巧滛技
深入分析声明与定义的区别
ATmega8535 ATmega8535L
电解电容的作用和使用注意事项

查找数据手册?

EEWorld Datasheet 技术支持

相关文章更多>>

德州仪器 2024年Q4财报解析：中国市场增长亮眼，目前没有收到反垄断调查通知
在 2024 年第四季度收益电话会议上，德州仪器（TI）向外界展示了一些好消息，尤其是凸显了中国市场在其全球布局中的关键地位。第四季度，TI 收入为 40 亿美元，环比下降 3%，比去年同期下
欧盟提议成立高级研究机构：专注于AI等战略技术以加强竞争力
据彭博社报道，欧盟将提议仿照美国政府实体建立一个高级研究项目机构，对战略技术进行投资，以此作为提高欧盟竞争力的更广泛努力的一部分。欧盟还将呼吁为 AI 建设新的超级计算基础设施。知情人士及文件显示
传台积电报废三万片晶圆，三万片受损
晶圆代工龙头厂台积电位于南科的晶圆厂，受地震影响的机台设备移位、晶圆破损经过抢修后，供应链传出，3、 5纳米的先进制程晶圆十八厂，预计将于23日达100%复机，准备恢复正常生产，晶圆十四厂复机还没有
中国芯片出口连续14个月增长
特朗普退出巴黎协定，芯片业碳中和完了没？
汇顶科技 2024 年业绩亮眼，展现强劲发展韧性
谷歌母公司：美国AI难保证对华领先不少方面是落后
消息称三星电子砍半晶圆代工部门 2025 年设备投资预算，陡降至 5 万亿韩元
史上最佳表现：SK 海力士 2024 年营业利润 23.5 万亿韩元
宇树发布“踢足球”机器人G1-Comp，网友：国足有救了

新帖速递

关闭

站长推荐

1/7

EEWorld订阅号

EEWorld服务号

汽车开发圈

About Us 关于我们客户服务联系方式器件索引网站地图最新更新手机版

用户热搜：

北京市海淀区中关村大街18号B座15层1530室电话:(010)82350740 邮编：100190

快速回复返回顶部返回列表

《大模型时代的基础架构》软件程序与专用硬件的结合 [复制链接]

GPU并行计算库

分布式AI训练

总结

浏览过的版块