jindong wang is here - 行为识别小组周报jd92.wang/assets/files/l05_deeplearning.pdf ·...

王晋东 2016.11.10

Upload: others

Post on 01-Apr-2020

1 views

Category:

Documents

0 download

Report

Download

Embed Size (px):

TRANSCRIPT

Page 1: Jindong Wang is Here - 行为识别小组周报jd92.wang/assets/files/l05_deeplearning.pdf · 2020-02-24 · Coursera Neural Networks for Machine Learning 16学时，每学时4-5段10分钟左右的视频，每节课1

王晋东

2016.11.10

Page 2: Jindong Wang is Here - 行为识别小组周报jd92.wang/assets/files/l05_deeplearning.pdf · 2020-02-24 · Coursera Neural Networks for Machine Learning 16学时，每学时4-5段10分钟左右的视频，每节课1

参考资料 Hinton在Coursera的公开课 LeCun Y, Bengio Y, Hinton G. Deep learning[J]. Nature, 2015, 521(7553): 436-444.

Bengio Y, Goodfellow I J, Courville A. Deep learning[J]. MIT. 2015.

Page 3: Jindong Wang is Here - 行为识别小组周报jd92.wang/assets/files/l05_deeplearning.pdf · 2020-02-24 · Coursera Neural Networks for Machine Learning 16学时，每学时4-5段10分钟左右的视频，每节课1

Coursera公开课介绍公开课设置

目前我的学习进度

一些关键点神经网络的学习模式

深度网络的分类与发展

MP神经元、感知机损失函数与激活函数

BP学习率、冲量等

Page 4: Jindong Wang is Here - 行为识别小组周报jd92.wang/assets/files/l05_deeplearning.pdf · 2020-02-24 · Coursera Neural Networks for Machine Learning 16学时，每学时4-5段10分钟左右的视频，每节课1

Coursera Neural Networks for Machine Learning 16学时，每学时4-5段10分钟左右的视频，每节课1个quiz，约7个问题。每3课1个编程作业，10个问题。

• Coursera was co-founded by Andrew Ng.

序号内容序号内容

1 介绍 9 规范化

2 感知机 10 联合网络

3 BP 11 Hopfield/Boltzmann

4 预测词汇 12 RBM

5 CNN与物体识别 13 DBN

6 如何使学习更快 14 预训练

7-8 RNN 15 层次化模型

Page 5: Jindong Wang is Here - 行为识别小组周报jd92.wang/assets/files/l05_deeplearning.pdf · 2020-02-24 · Coursera Neural Networks for Machine Learning 16学时，每学时4-5段10分钟左右的视频，每节课1

从机器学习的视角看神经网络终极目标：

学习有多种方法，复合形式：

恰恰是一种神经网络的形式！

把不同功能的函数按照一定层次进行复合

Directed Acyclic Graph (DAG)

Page 6: Jindong Wang is Here - 行为识别小组周报jd92.wang/assets/files/l05_deeplearning.pdf · 2020-02-24 · Coursera Neural Networks for Machine Learning 16学时，每学时4-5段10分钟左右的视频，每节课1

Page 7: Jindong Wang is Here - 行为识别小组周报jd92.wang/assets/files/l05_deeplearning.pdf · 2020-02-24 · Coursera Neural Networks for Machine Learning 16学时，每学时4-5段10分钟左右的视频，每节课1

Page 8: Jindong Wang is Here - 行为识别小组周报jd92.wang/assets/files/l05_deeplearning.pdf · 2020-02-24 · Coursera Neural Networks for Machine Learning 16学时，每学时4-5段10分钟左右的视频，每节课1

MP（McCulloch-Pitts）模型1943

感知机（Perceptron）1958遇到不匹配则调整权重

只能进行线性二类分类

Page 9: Jindong Wang is Here - 行为识别小组周报jd92.wang/assets/files/l05_deeplearning.pdf · 2020-02-24 · Coursera Neural Networks for Machine Learning 16学时，每学时4-5段10分钟左右的视频，每节课1

感知机权重调整

SVM

What’s the difference?损失函数

分类效果

Page 10: Jindong Wang is Here - 行为识别小组周报jd92.wang/assets/files/l05_deeplearning.pdf · 2020-02-24 · Coursera Neural Networks for Machine Learning 16学时，每学时4-5段10分钟左右的视频，每节课1

Page 11: Jindong Wang is Here - 行为识别小组周报jd92.wang/assets/files/l05_deeplearning.pdf · 2020-02-24 · Coursera Neural Networks for Machine Learning 16学时，每学时4-5段10分钟左右的视频，每节课1

映射（编码）输出的函数 Linear Binary ReLU（Rectified Linear Unit） Sigmoid Stochastic binary neurons Softmax

Why ReLU and Softmax popular?

Page 12: Jindong Wang is Here - 行为识别小组周报jd92.wang/assets/files/l05_deeplearning.pdf · 2020-02-24 · Coursera Neural Networks for Machine Learning 16学时，每学时4-5段10分钟左右的视频，每节课1

Why ReLU Tanh和sigmoid都会出现梯度消失的问题计算速度快（只有线性、比较操作）

ReLU会使一部分结果为0,使网络更稀疏

Why Softmax很多分类问题需要求概率映射

梯度消失的问题（1-0.0000001?）

Page 13: Jindong Wang is Here - 行为识别小组周报jd92.wang/assets/files/l05_deeplearning.pdf · 2020-02-24 · Coursera Neural Networks for Machine Learning 16学时，每学时4-5段10分钟左右的视频，每节课1

衡量模型预测与实际值的误差平方误差

Cross-entropy

Why Cross-entropy? 当预测值和真实值的差异巨大时，E将会有特别大的梯度

对后面的BP很方便

Page 14: Jindong Wang is Here - 行为识别小组周报jd92.wang/assets/files/l05_deeplearning.pdf · 2020-02-24 · Coursera Neural Networks for Machine Learning 16学时，每学时4-5段10分钟左右的视频，每节课1

Why BP? FP过程当然可以，然而代价太大

Cross-entropy:

Page 15: Jindong Wang is Here - 行为识别小组周报jd92.wang/assets/files/l05_deeplearning.pdf · 2020-02-24 · Coursera Neural Networks for Machine Learning 16学时，每学时4-5段10分钟左右的视频，每节课1

Gradient decent Stochastic gradient decent (SGD) Batch gradient decent (BGD) Mini-batch gradient decent (BGD)

Page 16: Jindong Wang is Here - 行为识别小组周报jd92.wang/assets/files/l05_deeplearning.pdf · 2020-02-24 · Coursera Neural Networks for Machine Learning 16学时，每学时4-5段10分钟左右的视频，每节课1

类似于物理学中的冲量

牛顿第二定律把GD想像成小球下山，一开始是往下落的，然而，当小球有速度之后，由于冲量的作用，但不一定会一直沿着梯度下降的方向落

人为加入momentum来控制方向

Page 17: Jindong Wang is Here - 行为识别小组周报jd92.wang/assets/files/l05_deeplearning.pdf · 2020-02-24 · Coursera Neural Networks for Machine Learning 16学时，每学时4-5段10分钟左右的视频，每节课1

什么是卷积？局部感受野

权值共享

池化

电采暖，推动能源消费革命 - cnjiwang.comjlrbszb.cnjiwang.com/pc/paper/att/201708/17/68aa0dda-a1f0-4120-a… · 段电价，峰时（8:00-21:00）电价为每千瓦时

艾瑞联合IMS（天下秀）发布 2019年 - DIGITALING艾瑞联合ims（天下秀）发布 ... 从移动互联网用户每天的触媒频次和触媒时间来看，kol也占据了用户每天大部分的上网时间。

每时每刻可信安全 1The DES algorithm is an example of what type of cryptography? A Secret Key B Two-key C Asymmetric Key D Public Key A

Node.js携程落地和最佳实践 · 1 面临的问题 2 3 Node.js最佳实践 4 ... -- 基础设施和核心中间件将云之间的差异抹平灰度与回滚 ... 每个响应的请求耗时每个Transaction的耗时跨应用调用的请求耗时

检索时间：2007 - yzu.edu.cndzzy.yzu.edu.cn/uploadfile/2006SCI.doc · Web view检索时间：2007.1.5 247条 Record 1 of 247 Author(s): Liu, YR (Liu, Yurong); Wang, ZD (Wang,

江南医院——医养结合的典范 · 散散步，和同事聊聊天，或者每隔几个小时在附近转一转，都可以改善心脏健康。 7.保持适度睡眠时间。每

Northwest Normal University · Web view每学年设置2个学期，共40周，其中教学时间36周（每学期18周），考试时间4周（每学期2周）。七、课程结构比例

每周增一天课每天加一课时 · 如破竹：郑州气温由前日40.5℃坠至昨日15.7℃，24小时降幅24.8℃，鄂西北昨也开始降温，重回凉爽。夜间热得爬起来开空调

本栏目编辑—毛建萍 - CECEP · 2015. 12. 31. · 01/02 本栏目编辑—毛建萍团队风采聪明、热情，每当有困难时总是能够及时出现解决问题；每当

Exhibition 展览 SPLENDOURS of L VE - SGM · 55100 Kuala Lumpur Organiser 主办马来西亚创价学会 Merdeka I / 默迪卡1（独立） / Oil on Canvas / 15 x 15cm / 2016 每日上午11时至下午5时（每逢星期一休馆）

诗学意识中的时间感悟wxb.whb.cn/images/2017-07/27/7/WX7B0727.pdf · !"#$%$%!! 平时看到关于批评的专题讨论! 每每围绕着理想的文艺批评展开" 理想的文学批评

2 0 1 9 时政周播单击此处编辑母版标题样式 · 单击此处编时辑政周母播：版每标周一题晚1样9:00式-20:00 资料领取：每周二早10:00后公众号回复“时政”领取

每时每刻可信安全 1 What category of water sprinkler system is currently the most recommended water system for a computer room? A Dry Pipe sprinkler system B Wet

· Web view4.2报名时间及地点：2019年 6 月10 日至 2019年 6 月 12日（法定公休日、法定节假日除外），每日上午8：30时至12：00时，下午14：00时至17：00时（北京时间，下同）在河南省地震局7楼717室领取招标文件。领取招标文件时

去哪儿网旅游安全手册目录 - Qunar.com...2018/07/11 · ଭ常博物馆每周会在特定工作日安排全天或半天馆维，且每天开馆时间时相对较短，

每时每刻可信安全 1The two most common implementations of Intrusion Detection are which of the following? A Netware-based and Host-based. B Network-based and Guest-based

HEALTHWEEKLY 拔罐好处多epaper.heyuan.cn/resfile/2018-09-07/07/07.pdf · 拔罐有一定危险性，每次拔罐时间以5分钟—15分钟为宜，时间不够起不到疗效，时间过长又会

《股票魔法师》共读 - xqdoc.imedao.comxqdoc.imedao.com/15a9237c27c2ded3fde786fe.pdf · 马克每周钻研70-80个小时，也就是每天10个小时以上，经常研究股票图表

饭盒子里的成长记忆 - pasb.zjsgat.gov.cnpasb.zjsgat.gov.cn/ztzk/page_8/202008/P... · 是啊，每个时代有每个时代的故事，小时候，我听爷爷奶奶、父亲母亲讲他们那时

广州市建设工程造价管理站文件 - zc.gov.cn · 1.表中每工日指每天按8小时工作时间计算。 2.劳务日工资价格包含了工资性收入、社会保险费、住房公积金、工会

CNT系列簡介 - 斯邁德 : Revolutions per hour. 每小时几转 M/min. : Meter per minute. 每分钟几公尺 Yd/min. : Yard per minute. 每分钟几码 SEC : Time of duty. 週期时间

在学校完成作业再回家！ - epaper.cqcb.com … · 内容：完成家庭作业+校本活动；延时服务放学时间：周一、二、三、五17：30；周四 15：35放学；费用为每人每月180元，自

· Web view凡有意参加投标者，请于2018年10月20日至2018年10月24日每日上午9:00时至11:30时，下午13:00时至16:30时携带法定代表人证书或法定代表人授权

设备名称：场发射扫描电子显微镜 - 重庆医科大学招标采购中心 · Web view购买日期：2016年7月年平均使用机时：900小时每年可供对外服务机时：200小时

PENANG - source.qunar.comsource.qunar.com/mkt_download/guide/penang/release/penang... · 由于每年举办的日期和时间不一定 , 具体的时间请以马来西亚旅游局官网

在线实验融入计算机教学 - USTC · –步骤停留时间：每个实验任务完成时间 –有效学习时间：真正敲代码的时间操作截图（300万分钟/月）

图书馆开放时间每周一～周五（二、三楼）中午 : 12 ： 00 —— 12 ： 40 ；每周一～周四（二楼）下午： 15 ： 30 —— 17 ： 00 ；

时间作为对抗—— 谈“王兵：三个肖像” - Wattis …073 时间作为对抗—— 谈“王兵：三个肖像” Time as Provocation: on “Wang Bing: Three Portraits”

每天学习一刻钟职场人生大不同优米 ◆ 校园 —————————————————— 传播价值影响时代

万兆校园网络安全解决方案 - Edu · 2009-6-1 助力高校应用，保障数字校园 page11 每cpu含8处理核每核主频1.2ghz 每个核具备4个虚拟cpu 每台设备具备64个vcpu同时进行运算

接待处-比利时-Besox · creating better environments 接待处-比利时-Besox 比利时接待处选用了Coral Welcome Volcano, 这是使每个人都受欢迎的系列

今年 810名菲华学生来闽学中文 - cnepaper.com · 规定华校的华语课只能作为选修课来学，每天学习的时间最多2个小时。在有的学校，每天安排给学生学习华语

每周行业要闻 - CCCMC · 同比减少11小时。其中，水电设备平均利用小时为3579小时，同比减少40小时；火电设备平均利用小时为4209小时，同比增加23小时。

陪“蜗牛”漫步围墙内外 - jydb.scedumedia.comjydb.scedumedia.com/upload/201705/b/17518105618781.pdf年级时，学校的阅读时间有限，家长们也忙，怎么保证孩子们每