92|0

5

帖子

0

TA的资源

一粒金砂(中级)

楼主
 

大规模语言模型从理论到实践目录和个人总体观后感 [复制链接]

# 本书一共九章

本书一共九章,循序渐进,但是个人阅读过程中,很多地方都卡壳,知识面过于单薄,一些专有名词和计算公式的表达难以消化理解,一头雾水。学习过程中,深刻认识到自己的不足之处,产生了畏难情绪,查阅资料,又不知道从哪里下手,论坛和资料,大多搜索不尽人意。本书作者和功底也确实认真有深刻,先下一番笨功夫,从尽力复刻一遍开始

## 第一章绪论
本章深入浅出介绍了大语言模型的基本概念、发展历程和构建流程。交代了本书的内容安排,把行文结构说明一番。
## 第二章大语言模型基础
本章令我困惑不已,本书的代码工具和编译器是什么?怎么构建结构?编码器和解码器是什么?可能这些问题很入门,但我确实事第一次接触大语言模型,这些问题想不明白,检索这些也是广告业务,代码更是看到云里雾里。

本章讲解了Transformer结构,生成式预训练语言模型GPT和大预言模型结构。代码部分我还在努力尝试看懂和复刻。
## 第三章大语言模型预训练数据
本章介绍了数据来源,数据处理数据影响分析和开源数据集部分。
一些专有名词还很细致的讲解。
剩余部分等下再更新。

 

点赞 关注

回复
举报
您需要登录后才可以回帖 登录 | 注册

随便看看
查找数据手册?

EEWorld Datasheet 技术支持

相关文章 更多>>
关闭
站长推荐上一条 1/8 下一条

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关: 国产芯 安防电子 汽车电子 手机便携 工业控制 家用电子 医疗电子 测试测量 网络通信 物联网

北京市海淀区中关村大街18号B座15层1530室 电话:(010)82350740 邮编:100190

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2025 EEWORLD.com.cn, Inc. All rights reserved
快速回复 返回顶部 返回列表