大规模语言模型从理论到实践目录和个人总体观后感
<p># 本书一共九章</p><p>本书一共九章,循序渐进,但是个人阅读过程中,很多地方都卡壳,知识面过于单薄,一些专有名词和计算公式的表达难以消化理解,一头雾水。学习过程中,深刻认识到自己的不足之处,产生了畏难情绪,查阅资料,又不知道从哪里下手,论坛和资料,大多搜索不尽人意。本书作者和功底也确实认真有深刻,先下一番笨功夫,从尽力复刻一遍开始</p>
<p>## 第一章绪论<br />
本章深入浅出介绍了大语言模型的基本概念、发展历程和构建流程。交代了本书的内容安排,把行文结构说明一番。<br />
## 第二章大语言模型基础<br />
本章令我困惑不已,本书的代码工具和编译器是什么?怎么构建结构?编码器和解码器是什么?可能这些问题很入门,但我确实事第一次接触大语言模型,这些问题想不明白,检索这些也是广告业务,代码更是看到云里雾里。</p>
<p>本章讲解了Transformer结构,生成式预训练语言模型GPT和大预言模型结构。代码部分我还在努力尝试看懂和复刻。<br />
## 第三章大语言模型预训练数据<br />
本章介绍了数据来源,数据处理数据影响分析和开源数据集部分。<br />
一些专有名词还很细致的讲解。<br />
剩余部分等下再更新。</p>
<p> </p>
<p></p>
<p>谢谢分享!</p>
<p>是不是因为大规模语言模型的代码不是开源的</p>
1084504793 发表于 2025-1-13 14:22
是不是因为大规模语言模型的代码不是开源的
<p>不太懂,我本科是电气的,看这个有一种大一看模电教材的感觉,看不懂,不知道哪里不懂,哪里都不懂的感觉,跳跃性好大,感觉还是有很强的专业学术壁垒,这已经是入门级的科普读物了。</p>
页:
[1]