★ 社区积分制度 ★ 新手必读 ★ 申请版主★

电子工程世界-论坛»论坛 › 电子技术交流 › 嵌入式系统 › 《大语言模型——原理与工程实践》第一章什么是大语言 ...

返回列表发新帖回复

阅 4276|回 0

皓月光兮非自明

89 帖子	0 TA的资源

一粒金砂（高级）

楼主

发表于2024-9-9 09:31 只看该作者

《大语言模型——原理与工程实践》第一章什么是大语言模型（一） [复制链接]

第一章什么是大语言模型

一、什么是大语言模型

大语言模型（Large Language Model，LLM）

大语言模型是人工智能领域的一项重要技术。

大语言模型在自然语言处理（Natural Language Processing，NLP）领域中被广泛应用。

大语言模型作为一种强大的语言处理技术，正在推动人工智能和自然语言处理领域的发展。通过深度学习和大规模数据集的训练，大语言模型能够理解和生成自然语言文本，在问答系统、机器翻译、文本生成等领域有着巨大的应用潜力。随着技术的不断进步，大语言模型将在未来进一步为人机交互和语言处理带来更多的创新和突破。

二、语言模型的发展

语言模型（Language Model，LM）

语言模型师自然语言处理的核心组件，它能够学习和理解人类语言的统计规律。即可以预测一个词序列的概率。

技术	优点	缺点
n-gram模型	最早的一种语言模型用于小规模数据	处置复杂任务和大数据环境时效果不佳
循环神经网络（Recurrent Neural Network，RNN）	处理短序列数据时效果为佳	处理长序列数据时效果不佳
长短时记忆网络（Long Short-Term Memory，LSTM）	能够捕获长距离的依赖关系，可以处理文本中长距离的依赖和复杂结构
Transformer架构	能够有效处理长序列，显著提升训练效率

三、GPT系列模型的发展

大语言模型的关键技术

ChatGPT是OpenAI基于GPT-3.5架构开发的大语言模型，它的训练过程分为三个部分：

（1）预训练阶段

模型通过自监督学习的方式进行训练，即在没有人工标注的情况下学习语言的统计属性。

预训练的目的是使模型能够理解和生成各种不同类型的文本。

（2）有监督微调阶段

微调是一种有监督学习的过程，需要使用人工标注的数据集来对模型进行训练，可以使模型在生成的回复更加准确和具有针对性。

（3）强化学习阶段

通过与自己对话进行训练，不需要人工标注的数据集。

使用近端策略优化（Proximal Policy Optimization，PPO）算法优化模型的生成策略。通过反复与模型进行对话，并根据生成回复的质量给予奖励或者惩罚，以调整模型的参数，使其生成更好的回复。

大语言模型

此帖出自嵌入式系统论坛

点赞关注

嵌入式论坛嵌入式开发嵌入式技术嵌入式教程

回复

举报

返回列表发新帖回复

开源项目更多>>

随便看看

关于研究精密监测仪器对在不同地区农作物的土壤肥力、生长发育、病虫害的数据采集和分o析处理
电子小白的农学毕业生想转行研究硬件加数字加农业有多大的可行力？求回复
《CMake构建实战》第二章-CMake简介和安装
【年终回炉：Luckfox幸狐 RV1106 Linux 开发板评测连载】6.AI示例+点灯
2010年视频监控市场技术指南(序列一
STM32串口设置时为什么一定要打开对应GPIO的时钟才能工作？
关于汽车警报电路
mos所有原理必看的哟
请大家帮忙帮我画个PCB 我要制电路板

查找数据手册?

EEWorld Datasheet 技术支持

相关文章更多>>

英飞凌2025年一季报电话会：预计2025财年展望营收或略有增长
2025 年是英飞凌独立上市 25 周年，自从西门子剥离之后，英飞凌摸索出了一条以“数字化和脱碳化”为主要发展脉络的经营理念。日前，英飞凌召开了2025财年一季报证明，数字化和脱碳化的未来正在
Intel全新处理器阵容曝光：最高52个内核/144MB缓存
2月8日消息，10年前谁能想到，Intel和AMD会是现在这种竞争局面呢？根据最新爆料，Ultra 200S系列“失利”后，Intel有望痛定思痛。近日，WccfTech分享了Intel未来的CP
三星电池隐患引发多品牌召回，涉及福特、奥迪、Stellantis 旗下超 18 万辆汽车
2 月 8 日消息，三星宣布了一项大规模召回计划，涉及福特、奥迪以及 Stellantis 旗下的 180,196 辆汽车，这些车辆所搭载的高压电池组存在故障风险，可能会引发火灾。在所有受影响的品
美国对华半导体限制新规生效：台积电暂停向部分IC设计厂商发货
曾控诉特斯拉抄袭：美国氢电动卡车制造商Nikola濒临破产
消息称苹果最快下周发布新款iPhone SE 有望月内发售
PI CEO：氮化镓将成为高压开关的首选
面临市场压力，消息称美国工业巨头霍尼韦尔将一拆为三
英特尔与日本AIST合作开发下一代量子计算机：万级量子比特
Videtronic开发出利用 GMSL2 延长树莓派摄像头电缆的方案

新帖速递

站长推荐

上一条

1/9

下一条

EEWorld订阅号

EEWorld服务号

汽车开发圈

About Us 关于我们客户服务联系方式器件索引网站地图最新更新手机版

站点相关：国产芯安防电子汽车电子手机便携工业控制家用电子医疗电子测试测量网络通信物联网

用户热搜：

北京市海淀区中关村大街18号B座15层1530室电话:(010)82350740 邮编：100190

电子工程世界版权所有京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函

京公网安备 11010802033920号 Copyright © 2005-2025 EEWORLD.com.cn, Inc. All rights reserved

微信扫描

快速回复返回顶部返回列表