¡¶¶¯ÊÖÑ§Éî¶ÈÑ§Ï°£¨PyTorch°æ£©¡·6¡¢ÏÖ´ú¾í»ýÉñ¾ÍøÂç

xinmeng_wit ·¢±íÓÚ 2024-11-6 21:01

Ò»¡¢Éî¶È¾í»ýÉñ¾ÍøÂç£¨AlexNet£©

1¡¢±³¾°

ÔÚ AlexNet ³öÏÖÖ®Ç°£¬¾í»ýÉñ¾ÍøÂçËäÒÑ±»Ìá³ö£¬µ«ÃæÁÙÖî¶àÏÞÖÆ¡£ÔçÆÚÊý¾Ý¼¯¹æÄ£Ð¡£¬´æ´¢ºÍÑÐ¾¿Ô¤ËãÓÐÏÞ£¬µ¼ÖÂÑÐ¾¿¶à»ùÓÚÐ¡ÐÍ¹«¿ªÊý¾Ý¼¯£¬Í¼Ïñ·Ö±æÂÊµÍÇÒÊýÁ¿ÉÙ¡£Í¬Ê±£¬Éñ¾ÍøÂç¼ÓËÙ¿¨ÐÔÄÜ²»×ã£¬¹Ø¼üÑµÁ·¼¼ÇÉÈ±Ê§£¬Ê¹µÃÉî¶ÈÑ§Ï°·¢Õ¹ÊÜ×è¡£¶ø´«Í³»úÆ÷Ñ§Ï°·½·¨ÔÚ¼ÆËã»úÊÓ¾õÁìÓòÕ¼Ö÷µ¼£¬ÆäÁ÷Ë®ÏßÒÀÀµÊÖ¹¤Éè¼ÆÌØÕ÷£¬¼ÆËã»úÊÓ¾õÑÐ¾¿ÈËÔ±¸üÖØÊÓÊý¾ÝÌØÕ÷¶ø·ÇÑ§Ï°Ëã·¨¡£

2¡¢AlexNet

2012Äê£¬AlexNetºá¿Õ³öÊÀ¡£ËüÊ×´ÎÖ¤Ã÷ÁËÑ§Ï°µ½µÄÌØÕ÷¿ÉÒÔ³¬Ô½ÊÖ¹¤Éè¼ÆµÄÌØÕ÷¡£ËüÒ»¾Ù´òÆÆÁË¼ÆËã»úÊÓ¾õÑÐ¾¿µÄÏÖ×´¡£ AlexNetÊ¹ÓÃÁË8²ã¾í»ýÉñ¾ÍøÂç£¬²¢ÒÔºÜ´óµÄÓÅÊÆÓ®µÃÁË2012ÄêImageNetÍ¼ÏñÊ¶±ðÌôÕ½Èü¡£

AlexNetºÍLeNetµÄ¼Ü¹¹·Ç³£ÏàËÆ£¬ÈçÏÂËùÊ¾¡£ 

<div style="text-align: left;"></div>

<div style="text-align: left;">
AlexNetºÍLeNetµÄÉè¼ÆÀíÄî·Ç³£ÏàËÆ£¬µ«Ò²´æÔÚÏÔÖø²îÒì¡£

<ul>
<li>AlexNet±ÈÏà¶Ô½ÏÐ¡µÄLeNet5ÒªÉîµÃ¶à¡£AlexNetÓÉ°Ë²ã×é³É£ºÎå¸ö¾í»ý²ã¡¢Á½¸öÈ«Á¬½ÓÒþ²Ø²ãºÍÒ»¸öÈ«Á¬½ÓÊä³ö²ã¡£</li>
<li>AlexNetÊ¹ÓÃReLU¶ø²»ÊÇsigmoid×÷ÎªÆä¼¤»îº¯Êý¡£</li>
</ul>

AlexNetÍ¨¹ýÔÝÍË·¨¿ØÖÆÈ«Á¬½Ó²ãµÄÄ£ÐÍ¸´ÔÓ¶È£¬¶øLeNetÖ»Ê¹ÓÃÁËÈ¨ÖØË¥¼õ¡£ ÎªÁË½øÒ»²½À©³äÊý¾Ý£¬AlexNetÔÚÑµÁ·Ê±Ôö¼ÓÁË´óÁ¿µÄÍ¼ÏñÔöÇ¿Êý¾Ý£¬Èç·×ª¡¢²ÃÇÐºÍ±äÉ«¡£ ÕâÊ¹µÃÄ£ÐÍ¸ü½¡×³£¬¸ü´óµÄÑù±¾Á¿ÓÐÐ§µØ¼õÉÙÁË¹ýÄâºÏ¡£ 

<pre>
<code class="language-python">import torch
from torch import nn
from d2l import torch as d2l

net = nn.Sequential(
# ÕâÀïÊ¹ÓÃÒ»¸ö11*11µÄ¸ü´ó´°¿ÚÀ´²¶×½¶ÔÏó¡£
# Í¬Ê±£¬²½·ùÎª4£¬ÒÔ¼õÉÙÊä³öµÄ¸ß¶ÈºÍ¿í¶È¡£
# ÁíÍâ£¬Êä³öÍ¨µÀµÄÊýÄ¿Ô¶´óÓÚLeNet
nn.Conv2d(1, 96, kernel_size=11, stride=4, padding=1), nn.ReLU(),
nn.MaxPool2d(kernel_size=3, stride=2),
# ¼õÐ¡¾í»ý´°¿Ú£¬Ê¹ÓÃÌî³äÎª2À´Ê¹µÃÊäÈëÓëÊä³öµÄ¸ßºÍ¿íÒ»ÖÂ£¬ÇÒÔö´óÊä³öÍ¨µÀÊý
nn.Conv2d(96, 256, kernel_size=5, padding=2), nn.ReLU(),
nn.MaxPool2d(kernel_size=3, stride=2),
# Ê¹ÓÃÈý¸öÁ¬ÐøµÄ¾í»ý²ãºÍ½ÏÐ¡µÄ¾í»ý´°¿Ú¡£
# ³ýÁË×îºóµÄ¾í»ý²ã£¬Êä³öÍ¨µÀµÄÊýÁ¿½øÒ»²½Ôö¼Ó¡£
# ÔÚÇ°Á½¸ö¾í»ý²ãÖ®ºó£¬»ã¾Û²ã²»ÓÃÓÚ¼õÉÙÊäÈëµÄ¸ß¶ÈºÍ¿í¶È
nn.Conv2d(256, 384, kernel_size=3, padding=1), nn.ReLU(),
nn.Conv2d(384, 384, kernel_size=3, padding=1), nn.ReLU(),
nn.Conv2d(384, 256, kernel_size=3, padding=1), nn.ReLU(),
nn.MaxPool2d(kernel_size=3, stride=2),
nn.Flatten(),
# ÕâÀï£¬È«Á¬½Ó²ãµÄÊä³öÊýÁ¿ÊÇLeNetÖÐµÄºÃ¼¸±¶¡£Ê¹ÓÃdropout²ãÀ´¼õÇá¹ýÄâºÏ
nn.Linear(6400, 4096), nn.ReLU(),
nn.Dropout(p=0.5),
nn.Linear(4096, 4096), nn.ReLU(),
nn.Dropout(p=0.5),
# ×îºóÊÇÊä³ö²ã¡£ÓÉÓÚÕâÀïÊ¹ÓÃFashion-MNIST£¬ËùÒÔÓÃÀà±ðÊýÎª10£¬¶ø·ÇÂÛÎÄÖÐµÄ1000
nn.Linear(4096, 10))</code></pre>

 

¶þ¡¢Ê¹ÓÃ¿éµÄÍøÂç£¨VGG£©
</div>

<div style="text-align: left;">ËäÈ»AlexNetÖ¤Ã÷Éî²ãÉñ¾ÍøÂç×¿ÓÐ³ÉÐ§£¬µ«ËüÃ»ÓÐÌá¹©Ò»¸öÍ¨ÓÃµÄÄ£°åÀ´Ö¸µ¼ºóÐøµÄÑÐ¾¿ÈËÔ±Éè¼ÆÐÂµÄÍøÂç¡£Ê¹ÓÃ¿éµÄÏë·¨Ê×ÏÈ³öÏÖÔÚÅ£½ò´óÑ§µÄ<a href="http://www.robots.ox.ac.uk/~vgg/">ÊÓ¾õ¼¸ºÎ×é£¨visual geometry group£©</a>µÄVGGÍøÂçÖÐ¡£Í¨¹ýÊ¹ÓÃÑ»·ºÍ×Ó³ÌÐò£¬¿ÉÒÔºÜÈÝÒ×µØÔÚÈÎºÎÏÖ´úÉî¶ÈÑ§Ï°¿ò¼ÜµÄ´úÂëÖÐÊµÏÖÕâÐ©ÖØ¸´µÄ¼Ü¹¹¡£</div>

<div style="text-align: left;">1¡¢VGG¿é</div>

<div style="text-align: left;">VGG¿éÓñ¾µä¾í»ýÉñ¾ÍøÂçµÄ×é³É²¿·Ö»ù±¾Ò»ÖÂ£¬ÓÉÒ»ÏµÁÐ¾í»ý²ã×é³É£¬ºóÃæÔÙ¼ÓÉÏÓÃÓÚ¿Õ¼äÏÂ²ÉÑùµÄ×î´ó»ã¾Û²ã¡£</div>

ÔÚÏÂÃæµÄ´úÂëÖÐ£¬ÎÒÃÇ¶¨ÒåÁËÒ»¸öÃûÎª<span style="background-color: rgb(250, 250, 250); color: rgb(56, 58, 66); font-family: "Source Code Pro", "DejaVu Sans Mono", "Ubuntu Mono", "Anonymous Pro", "Droid Sans Mono", Menlo, Monaco, Consolas, Inconsolata, Courier, monospace, "PingFang SC", "Microsoft YaHei", sans-serif; font-size: 12px;">vgg_blockµÄº¯ÊýÀ´ÊµÏÖÒ»¸öVGG¿é¡£

<pre>
<code class="language-python">import torch
from torch import nn
from d2l import torch as d2l

def vgg_block(num_convs, in_channels, out_channels):
layers = []
for _ in range(num_convs):
 layers.append(nn.Conv2d(in_channels, out_channels,
 kernel_size=3, padding=1))
 layers.append(nn.ReLU())
 in_channels = out_channels
layers.append(nn.MaxPool2d(kernel_size=2,stride=2))
return nn.Sequential(*layers)</code></pre>

¸Ãº¯ÊýÓÐÈý¸ö²ÎÊý£¬·Ö±ð¶ÔÓ¦ÓÚ¾í»ý²ãµÄÊýÁ¿<span style="background-color: rgb(250, 250, 250); color: rgb(56, 58, 66); font-family: "Source Code Pro", "DejaVu Sans Mono", "Ubuntu Mono", "Anonymous Pro", "Droid Sans Mono", Menlo, Monaco, Consolas, Inconsolata, Courier, monospace, "PingFang SC", "Microsoft YaHei", sans-serif; font-size: 12px;">num_convs¡¢ÊäÈëÍ¨µÀµÄÊýÁ¿<span style="background-color: rgb(250, 250, 250); color: rgb(56, 58, 66); font-family: "Source Code Pro", "DejaVu Sans Mono", "Ubuntu Mono", "Anonymous Pro", "Droid Sans Mono", Menlo, Monaco, Consolas, Inconsolata, Courier, monospace, "PingFang SC", "Microsoft YaHei", sans-serif; font-size: 12px;">in_channelsºÍÊä³öÍ¨µÀµÄÊýÁ¿<span style="background-color: rgb(250, 250, 250); color: rgb(56, 58, 66); font-family: "Source Code Pro", "DejaVu Sans Mono", "Ubuntu Mono", "Anonymous Pro", "Droid Sans Mono", Menlo, Monaco, Consolas, Inconsolata, Courier, monospace, "PingFang SC", "Microsoft YaHei", sans-serif; font-size: 12px;">out_channels¡£ 
 

2¡¢VGGÍøÂç

ÓëAlexNet¡¢LeNetÒ»Ñù£¬VGGÍøÂç¿ÉÒÔ·ÖÎªÁ½²¿·Ö£ºµÚÒ»²¿·ÖÖ÷ÒªÓÉ¾í»ý²ãºÍ»ã¾Û²ã×é³É£¬µÚ¶þ²¿·ÖÓÉÈ«Á¬½Ó²ã×é³É¡£

<div style="text-align: left;"></div>

<div style="text-align: left;">ÏÂÃæµÄ´úÂëÊµÏÖÁËVGG-11¡£¿ÉÒÔÍ¨¹ýÔÚ<span style="background-color: rgb(250, 250, 250); color: rgb(56, 58, 66); font-family: "Source Code Pro", "DejaVu Sans Mono", "Ubuntu Mono", "Anonymous Pro", "Droid Sans Mono", Menlo, Monaco, Consolas, Inconsolata, Courier, monospace, "PingFang SC", "Microsoft YaHei", sans-serif; font-size: 12px;">conv_archÉÏÖ´ÐÐforÑ»·À´¼òµ¥ÊµÏÖ¡£</div>

<pre>
<code class="language-python">def vgg(conv_arch):
conv_blks = []
in_channels = 1
# ¾í»ý²ã²¿·Ö
for (num_convs, out_channels) in conv_arch:
 conv_blks.append(vgg_block(num_convs, in_channels, out_channels))
 in_channels = out_channels

return nn.Sequential(
 *conv_blks, nn.Flatten(),
 # È«Á¬½Ó²ã²¿·Ö
 nn.Linear(out_channels * 7 * 7, 4096), nn.ReLU(), nn.Dropout(0.5),
 nn.Linear(4096, 4096), nn.ReLU(), nn.Dropout(0.5),
 nn.Linear(4096, 10))

net = vgg(conv_arch)</code></pre>

Èý¡¢º¬²¢ÐÐÁ¬½áµÄÍøÂç£¨GoogLeNet£©

ÔÚ2014ÄêµÄImageNetÍ¼ÏñÊ¶±ðÌôÕ½ÈüÖÐ£¬Ò»¸öÃû½ÐGoogLeNet (<a href="https://zh-v2.d2l.ai/chapter_references/zreferences.html#id162" title="Szegedy, C., Liu, W., Jia, Y., Sermanet, P., Reed, S., Anguelov, D., ¡ Rabinovich, A. (2015). Going deeper with convolutions. Proceedings of the IEEE conference on computer vision and pattern recognition (pp. 1¨C9).">Szegedy et al., 2015</a>)µÄÍøÂç¼Ü¹¹´ó·ÅÒì²Ê¡£ÕâÆªÂÛÎÄµÄÒ»¸öÖØµãÊÇ½â¾öÁËÊ²Ã´Ñù´óÐ¡µÄ¾í»ýºË×îºÏÊÊµÄÎÊÌâ¡£ ±Ï¾¹£¬ÒÔÇ°Á÷ÐÐµÄÍøÂçÊ¹ÓÃÐ¡µ½1×1£¬´óµ½11×11µÄ¾í»ýºË¡£

1¡¢Inception¿é

ÔÚGoogLeNetÖÐ£¬»ù±¾µÄ¾í»ý¿é±»³ÆÎªInception¿é£¨Inception block£©¡£ÕâºÜ¿ÉÄÜµÃÃûÓÚµçÓ°¡¶µÁÃÎ¿Õ¼ä¡·£¨Inception£©£¬ÒòÎªµçÓ°ÖÐµÄÒ»¾ä»°“ÎÒÃÇÐèÒª×ßµÃ¸üÉî”£¨“We need to go deeper”£©¡£

<div style="text-align: left;"></div>

 

Inception¿éÓÉËÄÌõ²¢ÐÐÂ·¾¶×é³É¡£ Ç°ÈýÌõÂ·¾¶Ê¹ÓÃ´°¿Ú´óÐ¡Îª1×1¡¢3×3ºÍ5×5µÄ¾í»ý²ã£¬´Ó²»Í¬¿Õ¼ä´óÐ¡ÖÐÌáÈ¡ÐÅÏ¢¡£ ÖÐ¼äµÄÁ½ÌõÂ·¾¶ÔÚÊäÈëÉÏÖ´ÐÐ1×1¾í»ý£¬ÒÔ¼õÉÙÍ¨µÀÊý£¬´Ó¶ø½µµÍÄ£ÐÍµÄ¸´ÔÓÐÔ¡£ µÚËÄÌõÂ·¾¶Ê¹ÓÃ3×3×î´ó»ã¾Û²ã£¬È»ºóÊ¹ÓÃ1×1¾í»ý²ãÀ´¸Ä±äÍ¨µÀÊý¡£ ÕâËÄÌõÂ·¾¶¶¼Ê¹ÓÃºÏÊÊµÄÌî³äÀ´Ê¹ÊäÈëÓëÊä³öµÄ¸ßºÍ¿íÒ»ÖÂ£¬×îºóÎÒÃÇ½«Ã¿ÌõÏßÂ·µÄÊä³öÔÚÍ¨µÀÎ¬¶ÈÉÏÁ¬½á£¬²¢¹¹³ÉInception¿éµÄÊä³ö¡£ÔÚInception¿éÖÐ£¬Í¨³£µ÷ÕûµÄ³¬²ÎÊýÊÇÃ¿²ãÊä³öÍ¨µÀÊý¡£

<pre>
<code class="language-python">import torch
from torch import nn
from torch.nn import functional as F
from d2l import torch as d2l

class Inception(nn.Module):
# c1--c4ÊÇÃ¿ÌõÂ·¾¶µÄÊä³öÍ¨µÀÊý
def __init__(self, in_channels, c1, c2, c3, c4, **kwargs):
 super(Inception, self).__init__(**kwargs)
 # ÏßÂ·1£¬µ¥1x1¾í»ý²ã
 self.p1_1 = nn.Conv2d(in_channels, c1, kernel_size=1)
 # ÏßÂ·2£¬1x1¾í»ý²ãºó½Ó3x3¾í»ý²ã
 self.p2_1 = nn.Conv2d(in_channels, c2, kernel_size=1)
 self.p2_2 = nn.Conv2d(c2, c2, kernel_size=3, padding=1)
 # ÏßÂ·3£¬1x1¾í»ý²ãºó½Ó5x5¾í»ý²ã
 self.p3_1 = nn.Conv2d(in_channels, c3, kernel_size=1)
 self.p3_2 = nn.Conv2d(c3, c3, kernel_size=5, padding=2)
 # ÏßÂ·4£¬3x3×î´ó»ã¾Û²ãºó½Ó1x1¾í»ý²ã
 self.p4_1 = nn.MaxPool2d(kernel_size=3, stride=1, padding=1)
 self.p4_2 = nn.Conv2d(in_channels, c4, kernel_size=1)

def forward(self, x):
 p1 = F.relu(self.p1_1(x))
 p2 = F.relu(self.p2_2(F.relu(self.p2_1(x))))
 p3 = F.relu(self.p3_2(F.relu(self.p3_1(x))))
 p4 = F.relu(self.p4_2(self.p4_1(x)))
 # ÔÚÍ¨µÀÎ¬¶ÈÉÏÁ¬½áÊä³ö
 return torch.cat((p1, p2, p3, p4), dim=1)</code></pre>

2¡¢GoogLeNetÄ£ÐÍ

GoogLeNetÒ»¹²Ê¹ÓÃ9¸öInception¿éºÍÈ«¾ÖÆ½¾ù»ã¾Û²ãµÄ¶ÑµþÀ´Éú³ÉÆä¹À¼ÆÖµ¡£Inception¿éÖ®¼äµÄ×î´ó»ã¾Û²ã¿É½µµÍÎ¬¶È¡£ µÚÒ»¸öÄ£¿éÀàËÆÓÚAlexNetºÍLeNet£¬Inception¿éµÄ×éºÏ´ÓVGG¼Ì³Ð£¬È«¾ÖÆ½¾ù»ã¾Û²ã±ÜÃâÁËÔÚ×îºóÊ¹ÓÃÈ«Á¬½Ó²ã¡£

<div style="text-align: left;"></div>

ÏÖÔÚ£¬ÎÒÃÇÖðÒ»ÊµÏÖGoogLeNetµÄÃ¿¸öÄ£¿é¡£

 

µÚÒ»¸öÄ£¿éÊ¹ÓÃ64¸öÍ¨µÀ¡¢7×7¾í»ý²ã¡£

<pre>
<code class="language-python">b1 = nn.Sequential(nn.Conv2d(1, 64, kernel_size=7, stride=2, padding=3),
 nn.ReLU(),
 nn.MaxPool2d(kernel_size=3, stride=2, padding=1))</code></pre>

µÚ¶þ¸öÄ£¿éÊ¹ÓÃÁ½¸ö¾í»ý²ã£ºµÚÒ»¸ö¾í»ý²ãÊÇ64¸öÍ¨µÀ¡¢1×1¾í»ý²ã£»µÚ¶þ¸ö¾í»ý²ãÊ¹ÓÃ½«Í¨µÀÊýÁ¿Ôö¼ÓÈý±¶µÄ3×3¾í»ý²ã¡£ Õâ¶ÔÓ¦ÓÚInception¿éÖÐµÄµÚ¶þÌõÂ·¾¶¡£

<pre>
<code class="language-python">b2 = nn.Sequential(nn.Conv2d(64, 64, kernel_size=1),
 nn.ReLU(),
 nn.Conv2d(64, 192, kernel_size=3, padding=1),
 nn.ReLU(),
 nn.MaxPool2d(kernel_size=3, stride=2, padding=1))</code></pre>

µÚÈý¸öÄ£¿é´®ÁªÁ½¸öÍêÕûµÄInception¿é¡£ µÚÒ»¸öInception¿éµÄÊä³öÍ¨µÀÊýÎª64+128+32+32=256£¬ËÄ¸öÂ·¾¶Ö®¼äµÄÊä³öÍ¨µÀÊýÁ¿±ÈÎª64:128:32:32=2:4:1:1¡£ µÚ¶þ¸öºÍµÚÈý¸öÂ·¾¶Ê×ÏÈ½«ÊäÈëÍ¨µÀµÄÊýÁ¿·Ö±ð¼õÉÙµ½96/192=1/2ºÍ16/192=1/12£¬È»ºóÁ¬½ÓµÚ¶þ¸ö¾í»ý²ã¡£µÚ¶þ¸öInception¿éµÄÊä³öÍ¨µÀÊýÔö¼Óµ½128+192+96+64=480£¬ËÄ¸öÂ·¾¶Ö®¼äµÄÊä³öÍ¨µÀÊýÁ¿±ÈÎª128:192:96:64=4:6:3:2¡£ µÚ¶þÌõºÍµÚÈýÌõÂ·¾¶Ê×ÏÈ½«ÊäÈëÍ¨µÀµÄÊýÁ¿·Ö±ð¼õÉÙµ½128/256=1/2ºÍ32/256=1/8¡£

<pre>
<code class="language-python">b3 = nn.Sequential(Inception(192, 64, (96, 128), (16, 32), 32),
 Inception(256, 128, (128, 192), (32, 96), 64),
 nn.MaxPool2d(kernel_size=3, stride=2, padding=1))</code></pre>

µÚËÄÄ£¿é¸ü¼Ó¸´ÔÓ£¬ Ëü´®ÁªÁË5¸öInception¿é£¬ÆäÊä³öÍ¨µÀÊý·Ö±ðÊÇ192+208+48+64=512¡¢160+224+64+64=512¡¢128+256+64+64=512¡¢112+288+64+64=528ºÍ256+320+128+128=832¡£ ÕâÐ©Â·¾¶µÄÍ¨µÀÊý·ÖÅäºÍµÚÈýÄ£¿éÖÐµÄÀàËÆ£¬Ê×ÏÈÊÇº¬3×3¾í»ý²ãµÄµÚ¶þÌõÂ·¾¶Êä³ö×î¶àÍ¨µÀ£¬Æä´ÎÊÇ½öº¬1×1¾í»ý²ãµÄµÚÒ»ÌõÂ·¾¶£¬Ö®ºóÊÇº¬5×5¾í»ý²ãµÄµÚÈýÌõÂ·¾¶ºÍº¬3×3×î´ó»ã¾Û²ãµÄµÚËÄÌõÂ·¾¶¡£ ÆäÖÐµÚ¶þ¡¢µÚÈýÌõÂ·¾¶¶¼»áÏÈ°´±ÈÀý¼õÐ¡Í¨µÀÊý¡£ ÕâÐ©±ÈÀýÔÚ¸÷¸öInception¿éÖÐ¶¼ÂÔÓÐ²»Í¬¡£

<pre>
<code class="language-python">b4 = nn.Sequential(Inception(480, 192, (96, 208), (16, 48), 64),
 Inception(512, 160, (112, 224), (24, 64), 64),
 Inception(512, 128, (128, 256), (24, 64), 64),
 Inception(512, 112, (144, 288), (32, 64), 64),
 Inception(528, 256, (160, 320), (32, 128), 128),
 nn.MaxPool2d(kernel_size=3, stride=2, padding=1))</code></pre>

µÚÎåÄ£¿é°üº¬Êä³öÍ¨µÀÊýÎª256+320+128+128=832ºÍ384+384+128+128=1024µÄÁ½¸öInception¿é¡£ ÆäÖÐÃ¿ÌõÂ·¾¶Í¨µÀÊýµÄ·ÖÅäË¼Â·ºÍµÚÈý¡¢µÚËÄÄ£¿éÖÐµÄÒ»ÖÂ£¬Ö»ÊÇÔÚ¾ßÌåÊýÖµÉÏÓÐËù²»Í¬¡£ ÐèÒª×¢ÒâµÄÊÇ£¬µÚÎåÄ£¿éµÄºóÃæ½ô¸úÊä³ö²ã£¬¸ÃÄ£¿éÍ¬NiNÒ»ÑùÊ¹ÓÃÈ«¾ÖÆ½¾ù»ã¾Û²ã£¬½«Ã¿¸öÍ¨µÀµÄ¸ßºÍ¿í±ä³É1¡£ ×îºóÎÒÃÇ½«Êä³ö±ä³É¶þÎ¬Êý×é£¬ÔÙ½ÓÉÏÒ»¸öÊä³ö¸öÊýÎª±êÇ©Àà±ðÊýµÄÈ«Á¬½Ó²ã¡£

<pre>
<code class="language-python">b5 = nn.Sequential(Inception(832, 256, (160, 320), (32, 128), 128),
 Inception(832, 384, (192, 384), (48, 128), 128),
 nn.AdaptiveAvgPool2d((1,1)),
 nn.Flatten())

net = nn.Sequential(b1, b2, b3, b4, b5, nn.Linear(1024, 10))</code></pre>

 

ºóÃæ»¹ÓÐÅúÁ¿¹æ·¶»¯£¬²Ð²îÍøÂçºÍ³íÃÜÁ¬½ÓÍøÂçµÈ£¬ÄÚÈÝÊµÔÚÊÇÌ«¶àÁË£¬Ò»Ê±¼äÃ»°ì·¨Ïû»¯ÕâÃ´¶àµÄÄÚÈÝ£¬ÇëÌýÏÂ»Ø·Ö½â¡£

hellokitty_bean ·¢±íÓÚ 2024-11-7 09:56

Ã¦ÀïÍµÏÐÀ´¿´WitµÄModern CNN.........<img height="48" src="https://bbs.eeworld.com.cn/static/editor/plugins/hkemoji/sticker/facebook/loveliness.gif" width="48" />

Õâ¸ö“ÏÖ´úµÄ”ÒâÎ¶£¬ÄÇÓ¦¸ÃÓÐ¶ÔÓ¦µÄ´«Í³µÄCNN£¿

ÔõÃ´·Ö´úµÄÄØ£¿

hellokitty_bean ·¢±íÓÚ 2024-11-7 10:01

´ÓÎÄ×ÖÖÐÀ´Àí½â£¬ÑîÁ¢À¤Ìá³öµÄCNN£¬¼°ºóÃæµÄVGG¡¢GoogleCNN¡¢²Ð²îÍøÂç¶¼ÊÇÔÚAlexNet»ù´¡ÉÏÌá³öÀ´µÄ£¬¶¼³ÆÎªÏÖ´úCNNÁË¡£<img height="63" src="https://bbs.eeworld.com.cn/static/editor/plugins/hkemoji/sticker/facebook/victory.gif" width="61" />

xinmeng_wit ·¢±íÓÚ 2024-11-9 20:39

hellokitty_bean ·¢±íÓÚ 2024-11-7 10:01
´ÓÎÄ×ÖÖÐÀ´Àí½â£¬ÑîÁ¢À¤Ìá³öµÄCNN£¬¼°ºóÃæµÄVGG¡¢GoogleCNN¡¢²Ð²îÍøÂç¶¼ÊÇÔÚAlexNet»ù´¡ÉÏÌá³öÀ´µÄ£¬¶¼³ÆÎª ...

¶ÔµÄ£¬ºóÃæµÄ¶¼ÊôÓÚÏÖ´ú¾í»ýÉñ¾ÍøÂç£¬<a href="https://home.eeworld.com.cn/space-uid-1144154.html" target="_blank">hellokitty</a>ÐÖÀí½âµÄ·Ç³£µ½Î»<img height="48" src="https://bbs.eeworld.com.cn/static/editor/plugins/hkemoji/sticker/facebook/wanwan88.gif" width="59" />

Ò³: [1]

µç×Ó¹¤³ÌÊÀ½ç-ÂÛÌ³'s Archiver

¡¶¶¯ÊÖÑ§Éî¶ÈÑ§Ï°£¨PyTorch°æ£©¡·6¡¢ÏÖ´ú¾í»ýÉñ¾­ÍøÂç

¡¶¶¯ÊÖÑ§Éî¶ÈÑ§Ï°£¨PyTorch°æ£©¡·6¡¢ÏÖ´ú¾í»ýÉñ¾ÍøÂç