电子工程世界-论坛»论坛 › 电子技术交流 › 嵌入式系统 › 《大语言模型——原理与工程实践》第五章挖掘大预言模 ...

阅 3798|回 0

89 帖子	0 TA的资源

一粒金砂（高级）

楼主

发表于2024-10-11 00:38 只看该作者

《大语言模型——原理与工程实践》第五章挖掘大预言模型潜能：有监督微调 [复制链接]

第五章、挖掘大预言模型潜能：有监督微调

一、监督微调

（一）监督微调

预训练阶段常使用大规模无监督的数据使模型获得丰富的知识和语言表示，但是无监督预训练模型不能直接用于解决特定任务或与人交流，这需要收集或构建符合人类需求的有监督数据进一步微调模型，模型可以从优监督的数据中学到如何完成特定任务，以及如何根据上下文以人类习惯的对话风格进行交流。

（二）有监督微调的作用与意义

定制化任务适应能力

通过有监督微调，可以学习任务特定的语言规则和上下文，将通用的预训练语言模型转化为针对特定任务的定制化模型，从而提高模型在特定任务上的性能，并更好地适应特定的任务需求。

提升泛化能力

通过有监督微调，可以在微调过程中引入特定语言格式的指令样本，使模型能够学习到更广泛的语言规律和结构，从而显著提升语言模型在未见过任务上的泛化能力，使得语言模型能够更加灵活地适应不同领域和任务的需求。

减少数据需求

有监督微调可以在一定程度上减少对大模型标准数据的依赖，有监督微调利用预训练模型已经学习到的语言表达能力，通过有限的指令样本就能实现模型的调整和优化，从而减少训练所需的标注数据量，降低了训练成本和时间成本。

灵活性和可迁移性

有监督微调使语言模型具备灵活性和可迁移性，在微调中可以将已经在上一个任务上进行优化的模型迁移到其他相关任务上，从而快速实现模型的迭代扩展，从而节省训练时间和资源，并且在不同任务之间实现知识的共享和传递。

二、有监督微调的应用场景

问答系统

有监督微调可以用于提高模型对问题的理解和答案生成能力，模型可以更好地理解问题的语义和上下文，为用户提供准确和详细的答案。

信息检索和推荐系统

有监督微调可以用于改进信息检索和推荐系统的性能，模型可以更好地理解用户查询和文档内容，提高相关性和推荐准确性。

机器翻译

有监督微调可以用于改进机器翻译系统的性能，模型可以更好地在源语言和目标语言之间建立更准确和流程的语义映射，从而提高翻译质量和自然度。

文本生成和摘要

有监督微调可以用于生成更句逻辑和连贯性的文本，满足特定任务的要求。

文本分类和情感分析

有监督微调可以用于文本分类任务，模型可以学习到特定领域或情感的语义表示，从而提高分类和情感分析的准确性。

大语音模型

此帖出自嵌入式系统论坛

点赞关注

嵌入式论坛嵌入式开发嵌入式技术嵌入式教程

返回列表发新帖回复

活动更多>>

开源项目更多>>

随便看看

RDK X3测评：5.ROS2命令行操作
ROS2（RobotOperatingSystem2）作为机器人开发领域的核心工具，其命令行操作是开发者与系统交互的重要桥梁。无论是启动节点、管理话题，还是调试参数、记录数据，ROS2命令行工具都提供了强大的支持。而TogetherROS是基于ROS2深度优化的，很多模块还是会复用RO ...
【MCXA156开发板测评】+基于串口屏的桌面化管控（2）
【新年花灯】时间催人奋进
盛群微控制器发展系统 HT-IDE3000版 SP3发布
P89LPC922FDH
2007年8月专题讨论----复位电路及看门狗
GigaDevice推出GD32 Colibri系列支持Arduino接口的开发套件
MIC噪音、回音严重怎么解决

查找数据手册?

EEWorld Datasheet 技术支持

相关文章更多>>

德州仪器 2024年Q4财报解析：中国市场增长亮眼，目前没有收到反垄断调查通知
在 2024 年第四季度收益电话会议上，德州仪器（TI）向外界展示了一些好消息，尤其是凸显了中国市场在其全球布局中的关键地位。第四季度，TI 收入为 40 亿美元，环比下降 3%，比去年同期下
欧盟提议成立高级研究机构：专注于AI等战略技术以加强竞争力
据彭博社报道，欧盟将提议仿照美国政府实体建立一个高级研究项目机构，对战略技术进行投资，以此作为提高欧盟竞争力的更广泛努力的一部分。欧盟还将呼吁为 AI 建设新的超级计算基础设施。知情人士及文件显示
传台积电报废三万片晶圆，三万片受损
晶圆代工龙头厂台积电位于南科的晶圆厂，受地震影响的机台设备移位、晶圆破损经过抢修后，供应链传出，3、 5纳米的先进制程晶圆十八厂，预计将于23日达100%复机，准备恢复正常生产，晶圆十四厂复机还没有
中国芯片出口连续14个月增长
特朗普退出巴黎协定，芯片业碳中和完了没？
汇顶科技 2024 年业绩亮眼，展现强劲发展韧性
谷歌母公司：美国AI难保证对华领先不少方面是落后
消息称三星电子砍半晶圆代工部门 2025 年设备投资预算，陡降至 5 万亿韩元
史上最佳表现：SK 海力士 2024 年营业利润 23.5 万亿韩元
宇树发布“踢足球”机器人G1-Comp，网友：国足有救了

新帖速递

关闭

站长推荐

1/6

EEWorld订阅号

EEWorld服务号

汽车开发圈

About Us 关于我们客户服务联系方式器件索引网站地图最新更新手机版

用户热搜：

北京市海淀区中关村大街18号B座15层1530室电话:(010)82350740 邮编：100190

快速回复返回顶部返回列表

《大语言模型——原理与工程实践》第五章 挖掘大预言模型潜能：有监督微调 [复制链接]

《大语言模型——原理与工程实践》第五章挖掘大预言模型潜能：有监督微调 [复制链接]