《拥抱AIGC》四、OpenAI与GPT

皓月光兮非自明 发表于 2024-10-10 01:11

本帖最后由皓月光兮非自明于 2024-10-11 15:44 编辑

OpenAI

    2015年，由Elon Musk、Sam Altman、Greg Brockman、Ilya Sutskever、Wojciech Zaremba、John Schulman成立的研究机构。专注研究深度强化学习（Deep Reindorcement Learning，DRL）

 

机构信条

   To Ensure That Artificial General Intelligence Benefits All Of Humanity（确保通用人工智能造福全人类）

 

深度强化学习

   深度强化学习DRL是强化学习（Reinforcement Learning，RL）与深度神经网络的结合，是机器学习的子集。

 

研究成果

<table style="border-collapse:collapse; border:none;Times New Roman"">
<tbody>
<tr>
<td style="border-bottom:1px solid black; border-top:1px solid black; border-right:1px solid black; border-left:1px solid black" valign="center">
时间
</td>
<td style="border-bottom:1px solid black; border-top:1px solid black; border-right:1px solid black; border-left:1px solid black" valign="center">
成果
</td>
<td style="border-bottom:1px solid black; border-top:1px solid black; border-right:1px solid black; border-left:1px solid black" valign="center">
描述
</td>
</tr>
<tr>
<td style="border-bottom:1px solid black; border-top:none; border-right:1px solid black; border-left:1px solid black" valign="center">
2016年
</td>
<td style="border-bottom:1px solid black; border-top:none; border-right:1px solid black; border-left:1px solid black" valign="center">
OpenAI Gym
</td>
<td style="border-bottom:1px solid black; border-top:none; border-right:1px solid black; border-left:1px solid black" valign="center">
开发测试强化学习的工具包
</td>
</tr>
<tr>
<td style="border-bottom:1px solid black; border-top:none; border-right:1px solid black; border-left:1px solid black" valign="center">
2018年
</td>
<td style="border-bottom:1px solid black; border-top:none; border-right:1px solid black; border-left:1px solid black" valign="center">
GPT - 1
</td>
<td style="border-bottom:1px solid black; border-top:none; border-right:1px solid black; border-left:1px solid black" valign="center">
生成式模型架构
</td>
</tr>
<tr>
<td style="border-bottom:1px solid black; border-top:none; border-right:1px solid black; border-left:1px solid black" valign="center">
2019年
</td>
<td style="border-bottom:1px solid black; border-top:none; border-right:1px solid black; border-left:1px solid black" valign="center">
GPT - 2
</td>
<td style="border-bottom:1px solid black; border-top:none; border-right:1px solid black; border-left:1px solid black" valign="center">
12亿参考参数
</td>
</tr>
<tr>
<td style="border-bottom:1px solid black; border-top:none; border-right:1px solid black; border-left:1px solid black" valign="center">
2020年
</td>
<td style="border-bottom:1px solid black; border-top:none; border-right:1px solid black; border-left:1px solid black" valign="center">
GPT - 3
</td>
<td style="border-bottom:1px solid black; border-top:none; border-right:1px solid black; border-left:1px solid black" valign="center">
1750亿参考参数
</td>
</tr>
<tr>
<td style="border-bottom:1px solid black; border-top:none; border-right:1px solid black; border-left:1px solid black" valign="center">
2023年
</td>
<td style="border-bottom:1px solid black; border-top:none; border-right:1px solid black; border-left:1px solid black" valign="center">
GPT - 4
</td>
<td style="border-bottom:1px solid black; border-top:none; border-right:1px solid black; border-left:1px solid black" valign="center">
通过图灵测试
</td>
</tr>
<tr>
<td style="border-bottom:1px solid black; border-top:none; border-right:1px solid black; border-left:1px solid black" valign="center">
2024年
</td>
<td style="border-bottom:1px solid black; border-top:none; border-right:1px solid black; border-left:1px solid black" valign="center">
GPT - 4o
</td>
<td style="border-bottom:1px solid black; border-top:none; border-right:1px solid black; border-left:1px solid black" valign="center">
部署跨文本、音视频推理模型
</td>
</tr>
</tbody>
</table>

 

模型意义

<ol>
<li align="justify">节省训练时间、节约训练成本</li>
<li align="justify">便于不具备数据科学或者机器学习技能的工程师使用</li>
</ol>

 

模型背后的数学原理

RNN的结构（循环神经网络，Recurrent Neural Network）

 

  

   RNN层在时间步骤t-n的输出，会被作为输入传递给下一个时间步骤。RNN的隐藏状态也会作为输入传递到下一个时间步骤，使得网络能够在输入序列的不同部分保存和传播。

   x为t时间的输入

   U为隐藏层h的加权输入

   h为t时间的隐藏层

   V为隐藏层h的加权输出

   y为t时间的输出

 

RNN的主要局限

（1）梯度消失和梯度爆炸

    在梯度反向传播过程中被多次相乘，导致梯度变得非常小或者非常大。

（2）有限的上下文

    一次只能处理一个元素的输入序列，所以只能捕捉到有限的上下文。

（3）并行化方面均在困难

    RNN本质是顺序执行，导致计算难以并行化，因此无法很好的利用GPU并行加速（图形处理单元，Graphical Processing Unit）

Jacktang 发表于 2024-10-10 07:24

在循环神经网络（RNN）中，每个时间步骤的输出不仅取决于当前时间步骤的输入，还取决于之前时间步骤的隐藏状态。RNN层在时间步骤t-n的输出可以通过以计算得出。

页: [1]

电子工程世界-论坛's Archiver

《拥抱AIGC》四、OpenAI与GPT