《拥抱AIGC》四、OpenAI与GPT
本帖最后由 皓月光兮非自明 于 2024-10-11 15:44 编辑<p align="justify"><b>OpenAI</b></p>
<p align="justify"> 2015年,由Elon Musk、Sam Altman、Greg Brockman、Ilya Sutskever、Wojciech Zaremba、John Schulman成立的研究机构。专注研究深度强化学习(Deep Reindorcement Learning,DRL)</p>
<p align="justify"> </p>
<p align="justify"><b>机构信条</b></p>
<p align="justify"> To Ensure That Artificial General Intelligence Benefits All Of Humanity(确保通用人工智能造福全人类)</p>
<p align="justify"> </p>
<p align="justify"><b>深度强化学习</b></p>
<p align="justify"> 深度强化学习DRL是强化学习(Reinforcement Learning,RL)与深度神经网络的结合,是机器学习的子集。</p>
<p align="justify"> </p>
<p align="justify"><b>研究成果</b></p>
<table style="border-collapse:collapse; border:none;Times New Roman"">
<tbody>
<tr>
<td style="border-bottom:1px solid black; border-top:1px solid black; border-right:1px solid black; border-left:1px solid black" valign="center">
<p align="center">时间</p>
</td>
<td style="border-bottom:1px solid black; border-top:1px solid black; border-right:1px solid black; border-left:1px solid black" valign="center">
<p align="center">成果</p>
</td>
<td style="border-bottom:1px solid black; border-top:1px solid black; border-right:1px solid black; border-left:1px solid black" valign="center">
<p align="center">描述</p>
</td>
</tr>
<tr>
<td style="border-bottom:1px solid black; border-top:none; border-right:1px solid black; border-left:1px solid black" valign="center">
<p align="center">2016年</p>
</td>
<td style="border-bottom:1px solid black; border-top:none; border-right:1px solid black; border-left:1px solid black" valign="center">
<p align="center">OpenAI Gym</p>
</td>
<td style="border-bottom:1px solid black; border-top:none; border-right:1px solid black; border-left:1px solid black" valign="center">
<p align="center">开发测试强化学习的工具包</p>
</td>
</tr>
<tr>
<td style="border-bottom:1px solid black; border-top:none; border-right:1px solid black; border-left:1px solid black" valign="center">
<p align="center">2018年</p>
</td>
<td style="border-bottom:1px solid black; border-top:none; border-right:1px solid black; border-left:1px solid black" valign="center">
<p align="center">GPT - 1</p>
</td>
<td style="border-bottom:1px solid black; border-top:none; border-right:1px solid black; border-left:1px solid black" valign="center">
<p align="center">生成式模型架构</p>
</td>
</tr>
<tr>
<td style="border-bottom:1px solid black; border-top:none; border-right:1px solid black; border-left:1px solid black" valign="center">
<p align="center">2019年</p>
</td>
<td style="border-bottom:1px solid black; border-top:none; border-right:1px solid black; border-left:1px solid black" valign="center">
<p align="center">GPT - 2</p>
</td>
<td style="border-bottom:1px solid black; border-top:none; border-right:1px solid black; border-left:1px solid black" valign="center">
<p align="center">12亿参考参数</p>
</td>
</tr>
<tr>
<td style="border-bottom:1px solid black; border-top:none; border-right:1px solid black; border-left:1px solid black" valign="center">
<p align="center">2020年</p>
</td>
<td style="border-bottom:1px solid black; border-top:none; border-right:1px solid black; border-left:1px solid black" valign="center">
<p align="center">GPT - 3</p>
</td>
<td style="border-bottom:1px solid black; border-top:none; border-right:1px solid black; border-left:1px solid black" valign="center">
<p align="center">1750亿参考参数</p>
</td>
</tr>
<tr>
<td style="border-bottom:1px solid black; border-top:none; border-right:1px solid black; border-left:1px solid black" valign="center">
<p align="center">2023年</p>
</td>
<td style="border-bottom:1px solid black; border-top:none; border-right:1px solid black; border-left:1px solid black" valign="center">
<p align="center">GPT - 4</p>
</td>
<td style="border-bottom:1px solid black; border-top:none; border-right:1px solid black; border-left:1px solid black" valign="center">
<p align="center">通过图灵测试</p>
</td>
</tr>
<tr>
<td style="border-bottom:1px solid black; border-top:none; border-right:1px solid black; border-left:1px solid black" valign="center">
<p align="center">2024年</p>
</td>
<td style="border-bottom:1px solid black; border-top:none; border-right:1px solid black; border-left:1px solid black" valign="center">
<p align="center">GPT - 4o</p>
</td>
<td style="border-bottom:1px solid black; border-top:none; border-right:1px solid black; border-left:1px solid black" valign="center">
<p align="center">部署跨文本、音视频推理模型</p>
</td>
</tr>
</tbody>
</table>
<p align="justify"> </p>
<p><b>模型</b><b>意义</b></p>
<ol>
<li align="justify">节省训练时间、节约训练成本</li>
<li align="justify">便于不具备数据科学或者机器学习技能的工程师使用</li>
</ol>
<p align="justify"> </p>
<p><b>模型背后的数学原理</b></p>
<p align="justify"><b>RNN的结构(循环神经网络,Recurrent Neural Network)</b></p>
<p align="center"> </p>
<p align="center"> </p>
<p align="justify"> RNN层在时间步骤t-n的输出,会被作为输入传递给下一个时间步骤。RNN的隐藏状态也会作为输入传递到下一个时间步骤,使得网络能够在输入序列的不同部分保存和传播。</p>
<p align="justify"> <u>x为t时间的输入</u></p>
<p align="justify"> <u>U为隐藏层h的加权输入</u></p>
<p align="justify"> <u>h为t时间的隐藏层</u></p>
<p align="justify"> <u>V为隐藏层h的加权输出</u></p>
<p align="justify"> <u>y为t时间的输出</u></p>
<p align="justify"> </p>
<p align="justify"><strong>RNN的主要局限</strong></p>
<p><strong>(1)梯度消失和梯度爆炸</strong></p>
<p align="justify"> 在梯度反向传播过程中被多次相乘,导致梯度变得非常小或者非常大。</p>
<p><strong>(2)有限的上下文</strong></p>
<p align="justify"> 一次只能处理一个元素的输入序列,所以只能捕捉到有限的上下文。</p>
<p><strong>(3)并行化方面均在困难</strong></p>
<p align="justify"> RNN本质是顺序执行,导致计算难以并行化,因此无法很好的利用GPU并行加速(图形处理单元,Graphical Processing Unit)</p>
<p>在循环神经网络(RNN)中,每个时间步骤的输出不仅取决于当前时间步骤的输入,还取决于之前时间步骤的隐藏状态。RNN层在时间步骤t-n的输出可以通过以计算得出。</p>
页:
[1]