算法导论 第三版英文版 有索引.pdf
《算法导论 第三版英文版 有索引.pdf》由会员分享,可在线阅读,更多相关《算法导论 第三版英文版 有索引.pdf(1313页珍藏版)》请在文库网上搜索。
1、. . . . . . . . . 187第七章深度学习的正则化1917.1参数范数惩罚. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1927.1.1 L2参数正则化. . . . . . . . . . . . . . . . . . . . . . . . . . 1937.1.2 L1参数正则化. . . . . . . . . . . . . . . . . . . . . . . . . . 1967.2作为约束的范数惩罚. . . . . . . . . . . . . . . . . . . . . .
2、 . . . . . 1987.3正则化和欠约束问题. . . . . . . . . . . . . . . . . . . . . . . . . . . 2007.4数据集增强. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2017.5噪声鲁棒性. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2027.5.1向输出目标注入噪声. . . . . . . . . . . . . . . . . . . . . . . 203
3、7.6半监督学习. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2037.7多任务学习. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2047.8提前终止. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2057.9参数绑定和参数共享. . . . . . . . . . . . . . . . . . . . . . . . . . . 21
4、17.9.1卷积神经网络. . . . . . . . . . . . . . . . . . . . . . . . . . . 2127.10稀疏表示. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2127.11 Bagging和其他集成的方法. . . . . . . . . . . . . . . . . . . . . . . . 2147.12 Dropout . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5、2167.13对抗训练. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2247.14切面距离、正切传播和流形正切分类器. . . . . . . . . . . . . . . . . 225第八章深度模型中的优化2288.1学习和优化有什么不同. . . . . . . . . . . . . . . . . . . . . . . . . . 2288.1.1经验风险最小化. . . . . . . . . . . . . . . . . . . . . . . . . 2298.1.2替代损失函数和提
6、前终止. . . . . . . . . . . . . . . . . . . . 2308.1.3批算法和minibatch算法. . . . . . . . . . . . . . . . . . . . . 2308.2神经网络的优化挑战. . . . . . . . . . . . . . . . . . . . . . . . . . . 2348.2.1病态. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2348.2.2局部极小值. . . . . . . . . . . . . . . . . .
7、. . . . . . . . . . 2358.2.3高原,鞍点和其他平坦区域. . . . . . . . . . . . . . . . . . . 237DRAFT仅供学习使用,不得用于商业目的。https:/ . . . . . . . . . . . . . . . . . . . . . . . . 2398.2.5长期依赖. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2408.2.6非精确梯度. . . . . . . . . . . . . . . . . . . . . . . . . . . . 241
8、8.2.7局部和全局结构间的弱对应. . . . . . . . . . . . . . . . . . . 2418.2.8优化的理论限制. . . . . . . . . . . . . . . . . . . . . . . . . 2438.3基本算法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2438.3.1随机梯度下降. . . . . . . . . . . . . . . . . . . . . . . . . . . 2438.3.2动量. . . . . . . . . . . .
9、. . . . . . . . . . . . . . . . . . . . 2458.3.3 Nesterov动量. . . . . . . . . . . . . . . . . . . . . . . . . . 2488.4参数初始化策略. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2498.5自适应学习率的算法. . . . . . . . . . . . . . . . . . . . . . . . . . . 2538.5.1 AdaGrad . . . . . . . . . . . . . . .
10、. . . . . . . . . . . . . . 2548.5.2 RMSProp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2548.5.3 Adam . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2558.5.4选择正确的优化算法. . . . . . . . . . . . . . . . . . . . . . . 2568.6二阶近似方法. . . . . . . . . . . . . . . . . . . . . . .
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 算法 导论 第三 英文 索引