HEU-liukai 发表于 2024-8-5 09:50

《大模型时代的基础架构》阅读心得——第一章:AI与大模型时代对基础架构的需求

<div class='showpostmsg'> 本帖最后由 HEU-liukai 于 2024-8-5 09:50 编辑

<p>本科刚毕业,非常荣幸参与了该书的测评活动,在此发表一下个人心得。</p>

<p>初读本书,整体感悟是通俗易懂:在本科期间,曾参与了一项智能检测水下机器人的项目,那是第一次接触到&ldquo;大模型&rdquo;、&ldquo;神经网络&rdquo;等词,对此并不太懂,难以理解,但是在阅读本书1.3节(一元线性回归算法剖析)中,作者用机器学习算法相关术语描述了该算法,个人感觉该例很好的将大模型概念以一种通俗易懂的形式向类似于我这类初学者讲明,所以也让我这样一个小白有了继续阅读下去的兴趣。</p>

<p>通过本书内容简介,可以迅速了解到本书第一章主要讲解了AI与大模型时代对基础架构的需求,本章所谈的AI即是机器学习算法,并以浅显的方式给了一定的推理便于读者理解,那么谈到机器学习算法,又固然离不开计算机硬件的支持,所以第一章简要说明机器学习算法相关概念后便为后续章节引入CPU和GPU等硬件的介绍作了铺垫。</p>

<p>同时,通过第一章的学习,本人也学习或又复习了许多概念,如下:</p>

<p>机器学习算法相关术语:训练样本、模型、模型的权重参数、训练、基于模型的权重的推理等;</p>

<p>计算机领域中的向量卷积(Vector Convolution)表示将乘法运算结果累加的算法,也称为&ldquo;向量点积&rdquo;(Vector Scalar Product);</p>

<p>计算机中最通用的运算部件是CPU的ALU(Arithmetic Logic Unit,算术逻辑单元);</p>

<p>图灵完备(Turing Complete):只要一台计算机能够实现图灵机的功能,就能够完成所有的计算任务,也就是图灵完备的;</p>

<p>图灵机在结构上包括以下几个部分:一条足够长的纸带(tape)、一个字符表(alphabet)、一个读写头(head)、一个状态寄存器(state register)、一个有限的指令集(instructions table);</p>

<p>GPGPU(General-Purpose Graphics Processing Unit,通用图形处理单元),GPGPU目前(截止到2024.7)是业界主流的机器学习算法依托的硬件计算单元;</p>

<p>机器学习算法的新引擎:TPU(Tensor Processing Unit,张量处理单元,擅长计算矩阵和向量,精简了其他计算功能)和NPU(Neural Processing Unit,神经网络处理单元)。其中,张量(Tensor)是一个数学名词。</p>

<p>&nbsp;</p>
</div><script>                                        var loginstr = '<div class="locked">查看本帖全部内容,请<a href="javascript:;"   style="color:#e60000" class="loginf">登录</a>或者<a href="https://bbs.eeworld.com.cn/member.php?mod=register_eeworld.php&action=wechat" style="color:#e60000" target="_blank">注册</a></div>';
                                       
                                        if(parseInt(discuz_uid)==0){
                                                                                                (function($){
                                                        var postHeight = getTextHeight(400);
                                                        $(".showpostmsg").html($(".showpostmsg").html());
                                                        $(".showpostmsg").after(loginstr);
                                                        $(".showpostmsg").css({height:postHeight,overflow:"hidden"});
                                                })(jQuery);
                                        }                </script><script type="text/javascript">(function(d,c){var a=d.createElement("script"),m=d.getElementsByTagName("script"),eewurl="//counter.eeworld.com.cn/pv/count/";a.src=eewurl+c;m.parentNode.insertBefore(a,m)})(document,523)</script>

秦天qintian0303 发表于 2024-8-6 08:50

<p>AI与大模型时代对基础架构,架构可能不同,不过基本原理应该都差不多</p>

HEU-liukai 发表于 2024-8-6 14:04

秦天qintian0303 发表于 2024-8-6 08:50
AI与大模型时代对基础架构,架构可能不同,不过基本原理应该都差不多

<p>哦哦~我第一次接触,正在学习阶段。<img height="48" src="https://bbs.eeworld.com.cn/static/editor/plugins/hkemoji/sticker/facebook/smile.gif" width="48" /></p>
页: [1]
查看完整版本: 《大模型时代的基础架构》阅读心得——第一章:AI与大模型时代对基础架构的需求