更新时间:2023-01-06 17:39:28
封面
版权页
译者序
前言
作译者简介
第1章 人工智能和机器人概述
1.1 人工智能、控制论和机器人学的基础知识
1.2 智能体
1.2.1 合理性的概念
1.2.2 系统动力学
1.2.3 任务环境
1.2.4 机器人和多智能体系统
1.3 推理
1.3.1 约束满足问题
1.3.2 通过搜索来求解CSP
参考文献
第2章 基本搜索算法
2.1 问题求解智能体
2.2 搜索求解
2.3 统一搜索
2.3.1 广度优先搜索
2.3.2 动态规划
2.3.3 深度优先搜索
2.4 有信息搜索
2.5 优化
2.5.1 线性规划
2.5.2 非线性规划
2.5.3 凸优化
第3章 机器学习基础
3.1 监督学习
3.1.1 回归
3.1.2 贝叶斯分类
3.1.3 KNN
3.1.4 支持向量机
3.2 无监督学习
3.2.1 K均值聚类
3.2.2 EM算法
3.2.3 主成分分析
3.3 深度神经网络
3.4 数据预处理
第4章 马尔可夫决策过程
4.1 统计决策
4.1.1 数学基础
4.1.2 贝叶斯决策
4.1.3 雷达信号探测
4.1.4 贝叶斯序贯决策
4.2 马尔可夫决策过程
4.2.1 马尔可夫决策过程的数学基础
4.2.2 最优策略
4.2.3 开发贝尔曼方程的解
4.3 决策及规划:动态规划
4.4 MDP的应用:搜索移动目标
4.5 多臂赌博机问题
4.5.1 ε-贪婪算法
4.5.2 上置信界
4.5.3 汤普森采样
第5章 强化学习
5.1 强化学习基础
5.1.1 重访多臂赌博机问题
5.1.2 强化学习基础
5.1.3 基于马尔可夫过程的强化学习
5.1.4 贝尔曼最优性原理
5.2 Q学习
5.2.1 部分可观测状态
5.2.2 Q学习算法
5.2.3 Q学习示例
5.3 无模型的学习
5.3.1 蒙特卡罗方法
5.3.2 时序差分学习
5.3.3 SARSA
5.3.4 Q学习与TD学习的关系
第6章 状态估计
6.1 估计基础
6.1.1 基于观测的线性估计量
6.1.2 线性预测
6.1.3 贝叶斯估计
6.1.4 极大似然估计
6.2 递归状态估计
6.3 贝叶斯滤波
6.4 高斯滤波
6.4.1 卡尔曼滤波
6.4.2 标量卡尔曼滤波
6.4.3 扩展卡尔曼滤波
第7章 定位
7.1 传感器网络定位
7.1.1 到达时间技术
7.1.2 到达角技术
7.1.3 到达时间差技术
7.2 移动机器人定位
7.3 同时定位与建图
7.3.1 概率SLAM
7.3.2 扩展卡尔曼滤波SLAM
7.3.3 立体摄像机辅助的SLAM
7.4 网络定位和导航