第1章人工智能与深度学习概述
视频讲解: 17分钟,3集
1.1人工智能与机器学习
1.1.1人工智能的发展历程
1.1.2机器学习及深度学习的发展历程
1.1.3人工智能与机器学习及深度学习的关系
1.2机器学习的分类
1.2.1监督学习
1.2.2非监督学习
1.2.3半监督学习
1.2.4强化学习
1.3深度学习的分类
1.3.1深度神经网络
1.3.2卷积神经网络
1.3.3其他深度神经网络
1.4深度学习与强化学习的结合
1.4.1强化学习
1.4.2强化学习算法分类
1.4.3深度强化学习
本章小结
第2章机器学习之回归任务
视频讲解: 12分钟,1集
2.1机器学习基础
2.2一元线性回归
2.3解析法实现一元线性回归
2.4解析法实现多元线性回归
2.4.1建立模型
2.4.2编程实现
2.5梯度下降法的基本原理
2.6梯度下降法求解线性回归
2.6.1求解一元线性回归
2.6.2求解多元线性回归
2.7TensorFlow实现梯度下降法
2.7.1TensorFlow的自动求导机制
2.7.2自动求导实现一元线性回归的梯度下降
2.7.3自动求导实现多元线性回归的梯度下降
本章小结
第3章机器学习之分类任务
视频讲解: 14分钟,2集
3.1分类任务与逻辑回归
3.1.1广义线性回归
3.1.2逻辑回归实现二分类
3.1.3交叉熵损失函数
3.1.4TensorFlow实现一元逻辑回归
3.1.5TensorFlow实现多元逻辑回归
3.2模型评估
3.3多分类任务
本章小结
第4章神经网络与深度学习
视频讲解: 11分钟,2集
4.1神经元与感知机
4.2单层神经网络的设计与实现
4.3深度学习
4.3.1多层神经网络
4.3.2机器学习与深度学习对比
4.3.3误差反向传播算法
4.3.4激活函数
4.4实例: 深度学习模型完成分类任务
本章小结
第5章深度神经网络的训练方法
视频讲解: 12分钟,3集
5.1梯度下降算法的优化
5.1.1梯度下降算法的问题
5.1.2基于动量的更新
5.1.3二阶优化方法
5.1.4共轭梯度
5.2自适应学习率算法
5.2.1学习率衰减
5.2.2AdaGrad算法
5.2.3RMSProp算法
5.2.4AdaDelta算法
5.2.5Adam算法
5.2.6几种常见优化算法的比较
5.3参数初始化
5.3.1合理初始化的重要性
5.3.2随机初始化
5.3.3Xavier初始化
5.3.4He初始化
5.3.5批量归一化
5.3.6预训练
5.4Sequential模型搭建和训练神经网络
5.5实例: 深度神经网络实现手写数字识别
本章小结
第6章卷积神经网络
视频讲解: 37分钟,6集
6.1计算机视觉问题
6.1.1图像分类
6.1.2目标定位
6.1.3目标检测
6.1.4图像分割
6.2图像卷积及卷积神经网络
6.2.1图像卷积
6.2.2池化和感受野
6.2.3基本网络结构
6.3实例: 卷积神经网络实现手写数字识别
6.4卷积神经网络的优化方法
6.4.1数据增强
6.4.2随机丢弃
6.4.3级联卷积
6.4.4集成学习
6.5实例: 卷积神经网络识别CIFAR-10数据
6.6实例: 基于DeepLab-V3+模型的轨道图像分割
本章小结
第7章典型的深度神经网络模型
视频讲解: 38分钟,5集
7.1卷积神经网络的发展
7.2经典网络LeNet
7.2.1LeNet结构
7.2.2实例: 搭建LeNet模型实现数字识别
7.2.3实例: 搭建LeNet模型实现CIFAR-10识别
7.3AlexNet模型
7.3.1AlexNet结构
7.3.2实例: 搭建AlexNet模型实现图片分类
7.4VGGNet模型
7.4.1VGGNet结构
7.4.2实例: 搭建VGG-16模型
7.5GoogLeNet模型
7.6ResNet模型
7.7循环神经网络
7.7.1RNN结构
7.7.2实例: RNN用于时序数据预测
本章小结
第8章强化学习算法
8.1强化学习综述
8.1.1目标、单步奖励与累积回报
8.1.2马尔可夫决策过程
8.1.3值函数与最优值函数
8.2动态规划方法
8.2.1策略迭代
8.2.2值迭代
8.3基于值函数的强化学习算法
8.3.1基于蒙特卡洛的强化学习算法
8.3.2基于时间差分的强化学习算法
8.3.3TDλ算法
8.4基于策略梯度的强化学习算法
8.4.1何时应用基于策略的学习方法
8.4.2策略梯度详解
8.4.3蒙特卡洛策略梯度算法
8.4.4Actor-Critic算法
8.5实例
8.5.1值迭代算法实例
8.5.2SARSA算法实例
8.5.3蒙特卡洛算法实例
8.5.4TD-Learning算法实例
8.5.5Q-Learning算法实例
本章小结
第9章深度强化学习
9.1基于值函数的深度强化学习
9.1.1深度Q学习
9.1.2深度Q学习的衍生方法
9.2基于策略梯度的深度强化学习
9.2.1深度确定性策略梯度算法
9.2.2异步深度强化学习算法
9.3实例
9.3.1DDPG实现pendulum-v0实例
9.3.2DDPG实现CartPole-v0实例
9.3.3DDPG实现MountainCar-v0实例
本章小结

