作者序

2016年以来，几乎所有人都在谈论人工智能，上至专家巨富，下至平民百姓。然而，究竟什么是人工智能？人工智能与传统科学有何区别和联系？人工智能的历史沿革和未来方向？这些问题在很多人脑海里还是模糊的。唯一可以确定的是，人工智能技术必然会对我们的生活产生深远的影响，这种影响会象蒸汽机、电、计算机的出现对我们的影响一样，成为我们未来生活的一部分。

我是学计算机出身，自1998年以来主要从事语音和语言信号处理工作。这个领域当然是人工智能的一部分，但绝大多数时候研究者们很少提到AI。原因有很多，对我而言也许是对归类法的执着，AI的范围太广了，当面带微笑和别人说` 我是做 AI的'总会有一种心虚的感觉。这种感觉应该是很多一线研究者的潜意识。

仅管对AI这个头衔有天然排斥，我们和这个古老而年轻的领域依然脱不了干系，因此当然希望更多年轻人加入到AI研究队伍中来，特别是从方法论的角度去理解AI，避免概念上的炒作和空洞化。

基于这一思路，我用了将近两年时间完成了一本题为《现代机器学习技术导论》的学习笔记[link]，恰好被利节老师看到。她提出建议：这本书应该让更多年轻人看到，但当前这个版本是不行的，需要更通俗和直观的表达。这个建议得到重庆巴蜀中学许莎老师的赞同，她觉得应该有一本通俗的读物，让高中生甚至初中生理解人工智能，在不增加日常学习压力的前提下，满足他们对新知识的渴求，从一开始就树立一个正确的概念体系和科学根基，为以后从事这方面的工作打下基础。

于是有了这本书。我们的目的只有一个：用浅显的的语言向年轻人介绍什么是人工智能，包括：人工智能有哪些主流技术，这些技术从何处来，到哪里去。特别重要的是，我们希望提供一系列小实验，让学生可以自己动手实现一些有趣的人工智能系统，培养出这一方面的兴趣，那就很好了。

在本书的成书过程中，众多老师和学生提供了热心帮助。清华大学的朱小燕老师对全书进行了审读，周强老师、刘华平老师分别对第四章和第五章进行了审读。清华大学语音语言实验室的蔡云麒博士参与了校订工作，实习生杜文强、张阳、吴嘉瑶、齐诏娣、于嘉威、姜修齐、刘逸博、汪洋等参与了实验样例设计。最后，清华出版社的刘翰鹏老师在本书出版过程中付出了大量心血，在此一并致谢！

章节目录

第1章 神奇的人工智能 [pdf]
1.1 什么是人工智能
1.2 人工智能简史
1.2.1 数理逻辑:人工智能的前期积累
1.2.2 图灵:人工智能的真正创始人
1.2.3 达特茅斯会议:AI的开端
1.2.4 人工智能的三起两落
1.3 机器学习:现代人工智能的灵魂
1.3.1 什么是机器学习
1.3.2 机器学习发展史
1.3.3 机器学习的基本框架
1.4 让人惊讶的“学习”
1.4.1 从猴子摘香蕉到星际大战
1.4.2 集体学习的机器人
1.4.3 图片和文字理解
1.4.4 AlphaGo
1.4.5 机器智能会超过人类智能吗
1.5 开始你的机器学习之旅
1.5.1 训练、验证与测试
1.5.2 Occam剃刀准则
1.5.3 没有免费的午餐
1.5.4 对初学者的几点建议
1.6 AIDemo示例系统

第2章 认识你的脸
2.1 人脸识别概述
2.1.1 什么是人脸识别
2.1.2 人脸识别系统的基本组成
2.1.3 人脸识别简史
2.2 基于特征脸的人脸识别
2.2.1 主成分分析
2.2.2 支持向量机
2.3 基于深度学习的人脸识别
2.3.1 神经网络的故事
2.3.2 神经网络结构
2.3.3 深度学习
2.3.4 基于深度卷积网络的人脸识别
2.3.5 基于DNN的人脸识别性能
2.4 深度神经网络的其他应用
2.4.1 人脸检测
2.4.2 人脸正规化
2.4.3 图像生成
2.4.4 图像风格转换
2.5 AIDemo:人脸识别


第3章 聆听你的声音
3.1 语音的产生与感知
3.1.1 语音的产生
3.1.2 语音的感知
3.2 语音识别概述
3.2.1 什么是语音识别
3.2.2 语音识别简史
3.3 基于GMM-HMM 的语音识别
3.3.1 MFCC特征提取
3.3.2 GMM-HMM 声学模型
3.3.3 N-Gram语言模型
3.3.4 解码过程
3.4 基于深度学习的语音识别
3.4.1 DNN特征提取
3.4.2 DNN静态建模
3.4.3 RNN动态建模
3.5 说话人识别
3.5.1 传统GMM-UBM 系统
3.5.2 基于DNN的说话人识别系统
3.6 语音合成
3.6.1 参数合成
3.6.2 拼接合成
3.6.3 统计模型合成
3.6.4 神经模型合成
3.7 AIDemo:语音信号处理

第4章 理解你的语言
4.1 人类语言的复杂性
4.1.1 结构复杂性
4.1.2 语义复杂性
4.1.3 知识复杂性
4.1.4 时空复杂性
4.1.5 应用复杂性
4.1.6 什么是语言理解
4.2 传统语言理解方法
4.2.1 词法分析
4.2.2 句法分析
4.2.3 语义分析
4.3 基于深度学习的语言理解方法
4.3.1 词向量
4.3.2 句向量
4.3.3 传统方法和深度学习方法对比
4.4 机器翻译
4.4.1 机器翻译的历史
4.4.2 统计机器翻译
4.4.3 神经机器翻译
4.5 语言理解的其他应用
4.5.1 搜索引擎
4.5.2 推荐系统
4.5.3 会话机器人
4.6 AIDemo:计算中文词向量


第5章 模仿你的行为
5.1 现代机器人发展史
5.2 基于设计的机器人
5.2.1 操作机器人
5.2.2 移动机器人
5.3 基于学习的机器人
5.3.1 简单的例子:模仿学习
5.3.2 强化学习
5.3.3 强化学习的学习对象
5.4 深度强化学习方法
5.4.1 Atari游戏
5.4.2 AlphaGoZero
5.4.3 实体机器人
5.4.4 两种机器人的比较

第6章 学习你的思维
6.1 形象思维
6.1.1 诗词生成
6.1.2 DeepDream
6.2 逻辑思维
6.2.1 定理证明:精确逻辑推理
6.2.2 阅读理解:非精确逻辑推理
6.3 AIDemo:DeepDream

勘误表

页号	勘误
前言	学习出一个合理的工人智能系统--> 合理的人工智能系统
5	1.2.3, 编程语言->对语言进行程序化

购买方式

天猫、京东、亚马逊等各大网站均有销售。

作者

联系方式

如您对本书有任何建议、意见、demo中的使用疑问和困难，以及与本书相关的技术探讨，请发邮件到： aibook@cslt.org

作者：王东，利节，许莎 出版社：清华大学 出版时间：2019-10 ISBN: 978-7-302-53187-6

最新消息： 本书配套课件免费公开，详见链接。

作者序

章节目录

勘误表

购买方式

相关资源

作者

联系方式

作者：王东，利节，许莎
出版社：清华大学
出版时间：2019-10
ISBN: 978-7-302-53187-6

最新消息：本书配套课件免费公开，详见链接。