188|2

18

帖子

0

TA的资源

一粒金砂(中级)

一切为了加速机器学习,GPU之间数据交换和访问存储IO体系--《大模型时代的基础架构》 [复制链接]

本帖最后由 superleon123 于 2024-9-30 11:33 编辑

    为了实现分布式大规模机器学习,需要一个大型的分布式计算机系统。而输入输出(I/O)设计是影响分布式计算机系统处理性能的重要因素。常见的分布式I/O系统,有用于虚拟系统中的VirIO,用于高性能计算的HPFS,以及用于大数据平台的HDFS。对于机器学习,nVidia设计了一个名为Magum的I/O框架,顾名思义,Magum就是巨大的意思。其关键思想是GPU Direct,即让GPU用尽量短的路径实现直通。因为GPU之间进行数据交换时吞吐率很高,如果还要经过CPU的话,会造成延迟。在传统的计算机体系结构中,在PCI-E之间传输数据时,需要通过CPU搬运数据,消耗CPU的资源并增加传输延时,使用GPU Direct就能解决这个问题。

    GPU Direct包括:

    1)Direct Shared Memory (DSM)--服务器内部的GPU互通

    GPU计算涉及大量数据的搬运,如果从系统内存到GPU内存都通过CPU来搬运数据,那CPU的负担就不小了。于是,nVidia推出了Direct Shared Memory技术,可以直接把数据从显存写到应用程序可以使用的用户态地址,在内存空间视图上实现了共享,避免了调用CPU对数据的再次访问与复制。减少了CPU的负担,减少了延时。

   之后的GPU Direct P2P技术,增加了对同一 PCI-E总线上GPU之间的点对点直接读取和交换数据的支持。

  2)Direct RDMA--跨服务器节点的GPU互通 

   因为NVlink和PCI-E总线无法实现跨服务器节点的GPU通信,所以一种名叫RDMA被设计出来,它能够绕过对端CPU,让对端网卡直接访问对端系统内存,是独立于TCP/IP协议栈的一个协议栈,由操作系统内核提供支持。

  3) Direct Storage--GPU对存储的访问

   因为传统的GPU从存储设备中获取数据方式,需要借助CPU的直接内存访问机制的介入,读取大量数据时,会占用CPU内部总线的资源。Direct Storage技术能绕过CPU,直接从NVMe SSD钟读取数据。

  

  除了上述的三种技术以外,Magnum IO还有其它技术作支撑。总之,这些技术都是为了多GPU之间交换数据和访问存储,加速机器学习计算,提供高效率和低延时的保障。

 

最新回复

支持一下楼主,感谢楼主提供的GpU相关的技术信息,非常详细,希望继续分享更多相关内容   详情 回复 发表于 2024-10-1 07:00

回复
举报

709

帖子

5

TA的资源

纯净的硅(高级)

支持一下楼主,感谢楼主提供的GpU相关的技术信息,非常详细,希望继续分享更多相关内容

点评

感谢支持! 有机会大家多交流!  详情 回复 发表于 2024-10-1 16:35

回复

18

帖子

0

TA的资源

一粒金砂(中级)

chejm 发表于 2024-10-1 07:00 支持一下楼主,感谢楼主提供的GpU相关的技术信息,非常详细,希望继续分享更多相关内容

感谢支持! 有机会大家多交流!


回复
您需要登录后才可以回帖 登录 | 注册

随便看看
查找数据手册?

EEWorld Datasheet 技术支持

相关文章 更多>>
推荐帖子
成就单片机高手---不得不看

1.不要看到别人的回复第一句话就说:给个代码吧!你应该想想为什么。当你自己想 出来 再参考别人的提示,你就知道自己和别人思路 ...

【备战2011国赛子分类】——仪器仪表类+资料锦集

本帖最后由 paulhyde 于 2014-9-15 03:01 编辑

富士通DIY板仿真方法

先告诉大家一个不好消息:“富士通Easy Kit板”板载MLINK不支持MB9BF506N(见下图)。但我们仍然可以用“富士通Easy Kit板”板载ML ...

【最新神器】Atmel强大的MCU设计工具最新特点介绍--EE大学堂

Atmel强大的MCU设计工具最新特点介绍:https://training.eeworld.com.cn/course/1918为了让工程师方便地设计并降低难度,Atmel提 ...

数字地和模拟地的桥接

之前的很多PCB设计中都会区分数字地和模拟地以此来减小干扰,桥接两者一般都是使用磁珠或者0R的电阻,最近看到一个产品设计中, ...

听说,GD32H7要发布

如果发布了,算不算国产首个M7内核的mcu,听说国产M7内核的MCU挺少的 想找个stm32h7的替代都难,以下是官方发布消息: 兆 ...

【得捷电子Follow me第1期】004:GPS定位并显示

上一帖介绍网络连接和同步时钟。这一贴介绍GPS定位数据获取并把数据显示在OLED上。参考大佬给的文档和代码,我的试验过程如下。 ...

mos管用于电池防反接的方案比较

740264 看了一篇介绍mos管用在电池防反接电路中,大家看看哪个方案更好? 1.方案1中当mos导通后,寄生二极管会不会被短路 ...

难得好天气,躲进山里清净一下

821917 821918 821920 821919

关闭
站长推荐上一条 1/10 下一条

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关: 国产芯 安防电子 汽车电子 手机便携 工业控制 家用电子 医疗电子 测试测量 网络通信 物联网

北京市海淀区中关村大街18号B座15层1530室 电话:(010)82350740 邮编:100190

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved
快速回复 返回顶部 返回列表