大规模语言模型从理论到实践目录和个人总体观后感
[复制链接]
# 本书一共九章
本书一共九章,循序渐进,但是个人阅读过程中,很多地方都卡壳,知识面过于单薄,一些专有名词和计算公式的表达难以消化理解,一头雾水。学习过程中,深刻认识到自己的不足之处,产生了畏难情绪,查阅资料,又不知道从哪里下手,论坛和资料,大多搜索不尽人意。本书作者和功底也确实认真有深刻,先下一番笨功夫,从尽力复刻一遍开始
## 第一章绪论
本章深入浅出介绍了大语言模型的基本概念、发展历程和构建流程。交代了本书的内容安排,把行文结构说明一番。
## 第二章大语言模型基础
本章令我困惑不已,本书的代码工具和编译器是什么?怎么构建结构?编码器和解码器是什么?可能这些问题很入门,但我确实事第一次接触大语言模型,这些问题想不明白,检索这些也是广告业务,代码更是看到云里雾里。
本章讲解了Transformer结构,生成式预训练语言模型GPT和大预言模型结构。代码部分我还在努力尝试看懂和复刻。
## 第三章大语言模型预训练数据
本章介绍了数据来源,数据处理数据影响分析和开源数据集部分。
一些专有名词还很细致的讲解。
剩余部分等下再更新。
|