《大模型时代的基础架构》软件程序与专用硬件的结合

ltaodream 发表于 2024-9-16 23:00

<div class='showpostmsg'><section _blank="" data-tool="mdnice编辑器" data-website="<a target=" id="nice">
<h2 data-tool="mdnice编辑器">GPU并行计算库</h2>

<p data-tool="mdnice编辑器">第二章比较了C语言和GPU实现向量加法代码的区别，来体现在GPU上运行的CUDA是一个原生为并行计算设计的框架。</p>

<p data-tool="mdnice编辑器">CUDA向开发者屏蔽了内存数据传输到方式，在libcudart.so等动态链接库中调用了GPU的KMD来让GPU执行计算。</p>

<ul data-tool="mdnice编辑器">
<li>
<section>KMD：Kernel Mode Driver，内核模式驱动</section>
</li>
</ul>

<h2 data-tool="mdnice编辑器">分布式AI训练</h2>

<ul data-tool="mdnice编辑器">
<li>
<section>模型并行策略：将模型部署到很多设备上，由于显存限制，当模型很大的时候，单个模型难以跑在单个GPU。</section>
</li>
<li>
<section>数据并行策略：多个GPU上放置相同模型，各个GPU采用不同的数据进行训练。</section>
</li>
</ul>

<h2 data-tool="mdnice编辑器">总结</h2>

<p data-tool="mdnice编辑器">希望可以对大家去学习CUDA和TensorFlow的原理起到抛砖引玉的效果。深入AI，学习原理必不可少。</p>
</section>
</div><script> var loginstr = '<div class="locked">查看本帖全部内容，请<a href="javascript:;" style="color:#e60000" class="loginf">登录</a>或者<a href="https://bbs.eeworld.com.cn/member.php?mod=register_eeworld.php&action=wechat" style="color:#e60000" target="_blank">注册</a></div>';

if(parseInt(discuz_uid)==0){
(function($){
var postHeight = getTextHeight(400);
$(".showpostmsg").html($(".showpostmsg").html());
$(".showpostmsg").after(loginstr);
$(".showpostmsg").css({height:postHeight,overflow:"hidden"});
})(jQuery);
} </script><script type="text/javascript">(function(d,c){var a=d.createElement("script"),m=d.getElementsByTagName("script"),eewurl="//counter.eeworld.com.cn/pv/count/";a.src=eewurl+c;m.parentNode.insertBefore(a,m)})(document,523)</script>

页: [1]

电子工程世界-论坛's Archiver

《大模型时代的基础架构》软件程序与专用硬件的结合