反向传播与随机梯度下降

反向传播与随机梯度下降

news/2024/6/16 21:28:27 标签: 神经网络, 人工智能, 深度学习

反向传播实际上就是在算各个阶段梯度，每层的传入实际是之前各层根据链式法则梯度相乘的结果。反向传播最初传入的Δout是1，Δ通常表示很少量的意思，Δout=1的时候这样在反向传播的时候算出来的dw和dx刚好就是当前梯度。深度神经网络中每层都会记录正向传播时该层传入的x，就是为了反向传播的时候计算dw的时候用到。反向传播的时候也会利用w计算出dx来作为下一层的反向传播的输入。反向传播时每层的输入都是前几层梯度相乘的结果（链式法则），每层的输出也应该是本层梯度乘以输入的结果（链式法则），需要注意的是计算MatMul节点的反向传播时要注意矩阵形状，所以需要矩阵转置。反向传播计算的各种梯度就是为了梯度下降做准备工作。

梯度下降的时候代码如下：

class SGD:

def __init__(self, lr=0.01):

self.lr = lr

def update(self, params, grads):

for i in range(len(params)):

params[i] -= self.lr * grads[i]

params 是每层神经网络的w和b，grads 对应的是各层参数的梯度。 params[i] -= self.lr * grads[i] 表示每层的w和b都要梯度下降，这是因为反向传播的时候，每层的梯度都是损失函数f_loss(x)对x的导数的一部分，根据链式法则，因为链式法则是相乘关系所以每个因子梯度下降总体梯度也是下降的。

代码来源《深度学习进阶-自然语言处理》第一章

http://www.niftyadmin.cn/n/141387.html

相关文章

Stable Diffusion Prompt用法

Stable Diffusion Prompt用法

Stable Diffusion可以根据你输入的提示词（prompt）来绘制出想象中的画面。 1、正向提示词（Prompt）： 提高图像质量的prompt: prompt用途HDR, UHD, 64K(HDR、UHD、4K、8K和64K)这样的质量词可以带来巨大的差异提升照片…

阅读更多...

docker安装nginx

docker安装nginx

1、拉取镜像 docker pull nginx:1.23.0 2、创建挂载目录 mkdir -p /mnt/nginx/{conf.d,logs,html,conf} 3、创建容器（用于拷贝相关文件到挂载目录，看第四步。这个弄完第四步可以删掉） docker run --name nginx8081 -p 8081:80 -d nginx:…

阅读更多...

MGRE综合实验

MGRE综合实验

实验拓扑及相关要求： IP地址配置： ip规划如该拓扑上可视缺省路由： [r1]ip route-static 0.0.0.0 0 15.0.0.2 [r2]ip route-static 0.0.0.0 0 25.0.0.2 [r3]ip route-static 0.0.0.0 0 35.0.0.2 [r4]ip route-static 0.0.0.0 0 45.0.0.2 公…

阅读更多...

【STL】list剖析及模拟实现

【STL】list剖析及模拟实现

✍作者：阿润菜菜 📖专栏：C 初识list 1. list基本概况 list是可以在常数范围内在任意位置进行插入和删除的序列式容器，并且该容器可以前后双向迭代。list的底层是双向链表结构，双向链表中每个元素存储在互不相关的独立…

阅读更多...

SQL注入基本概念

SQL注入基本概念

目录 SQL注入原理 SQL注入过程 SQL注入带来的危害判断是否存在SQL注入 SQL手工注入过程常见SQL注入类型联合查询布尔盲注时间注入报错注入 extractvalue报错注入 updatexml报错注入宽字节注入二次注入 SQL注入原理服务端没有过滤用户输入的恶意数据，直接把…

阅读更多...

【设计模式】备忘录模式和迭代器模式

【设计模式】备忘录模式和迭代器模式

备忘录模式和迭代器模式备忘录模式代码示例迭代器模式代码示例使用迭代器遍历集合的同时不能删除/增加元素总结备忘录模式备忘录模式，也叫快照（Snapshot）模式。在 GoF的《设计模式》⼀书中，备忘录模式是这么定义的：…

阅读更多...

一次Android App NDK崩溃问题的分析及解决

一次Android App NDK崩溃问题的分析及解决

文章目录小结NDK崩溃的问题通过logcat查看崩溃日志提取tombstone的记录通过ndk-stack来输出日志取得的日志分析并解决分析使用add2line定位具体报错的行数解决参考小结最近碰一次Android App NDK崩溃的问题，这个NE（Native Exception）是从ND…

阅读更多...

超超超超保姆式详解——字符函数和字符串函数（学不会打我）上

超超超超保姆式详解——字符函数和字符串函数（学不会打我）上

目录长度不受限制的字符串函数 strlen部分 strlen函数的易错小知识 strlen函数的实现 strcpy部分 strcat部分自己实现strcat strstr函数部分简单例子： 分析 strcmp部分长度受限制的字符串函数 strncpy 简单例子 strncat strncmp 简单例子 &…

阅读更多...

最新文章