“人工智能”如何“深度学习”

2017-09-25作者:龙飞编辑:书问

深度学习技术是人工智能(AI)的一个重要实现方法,在语音识别、图像识别、自然语言处理和搜索广告预估等领域的应用都取得了惊人的进展。缘其如此,谷歌、微软、阿里、腾讯、百度等全球著名的高科技公司争相投入资源,占领深度学习的技术制高点。各大公司以深度学习为主要研究方向的研究院所纷纷成立,大量技术人员涉足深度学习领域,大量以深度学习为核心技术的创业公司涌现。可以想象在不久的未来,以深度学习为代表的人工智能技术将渗入人们生活的方方面面,像水、电、气等基础资源一样与人们的生活息息相关。在智能家居、自动驾驶、机器人、无人机等领域大显身手,并逐步完成从云端到终端的转化。


《深度学习入门与实践》包含六方面的内容,结合理论与实践全面阐释了深度学习的原理及应用、具有详尽的原理分析、程序验证。


此书第一部分介绍了深度学习和机器学习的基本知识,阐述了人工智能、机器学习和深度学习之间的关系。通俗的讲解深度学习的常用概念及概念之间的关系,如回归、分类、聚类;监督学习、非监督学习、强化学习;感知机、神经网络等。随后介绍了深度学习的发展历程及前辈学者们对深度学习领域所做出的贡献。最后列出了深度学习及相关领域的著名国际会议、期刊、赛事和学术团队,以方便读者获取学习资料和进行学术研究。


图1.1 常用概念文氏图.jpg


图1.1 常用概念文氏图


此书第二部分介绍了深度学习的原理,回归的概念。以生物学家Galton所研究的父子身高问题为例介绍了线性回归的基本原理,讲述了线性回归的两种求解方法:梯度下降法和正规方程法,并用R、MATLAB和Python三种工具求解了父子身高问题。随后以学生考试问题为例介绍了逻辑回归的基本原理,给出了逻辑回归问题求解的过程,并用R、MATLAB和Python三种工具解决了学生考试问题。


图2.8 非凸函数J(θ0, θ1)梯度下降.jpg

图2.8 非凸函数J(θ0, θ1)梯度下降


此书第三部介绍了神经网络的工作流程。阐述了神经网络的基本单元Rosenblatt感知机的工作原理和训练方法,并以一个二维空间中线性可分的点集为例验证了感知机的训练方法。随后简要介绍了人工神经网络的由来、网络架构和训练方法。最后用Pybrain实现了一个三层神经网络,借助实例初步展现了人工神经网络的神奇功能。


图3.9MNIST手写数字识别神经网络结构.jpg

图3.9MNIST手写数字识别神经网络结构


此书第四部分介绍了Caffe所基于的基本架构,卷积神经网络CNN的由来和基本工作原理。阐述了Caffe架构中Blob、Layer、Net和Solver等几个基本类的作用,并以一个车型识别的简单实例初步验证了Caffe的功能。最后介绍了目标检测的基本原理和几个当前最流行的算法:Faster R-CNN、YOLO和SSD等,并用开源的Caffe实例验证了Faster R-CNN和SSD算法的性能。图片分类和目标检测是深度学习在图像识别领域的两个重要应用,事实证明,Caffe对这两个应用有着较好的支持。


图4.25网络结构.jpg

图4.25网络结构


 

图4.36YOLO算法原理.jpg

图4.36YOLO算法原理


此书第五部分介绍了TensorFlow的由来和基本工作原理。阐述了TensorFlow架构中图、张量、运算和会话等基本概念,以一个简单的计算应用让读者初步认识TensorFlow。随后用TensorFlow重写了父子身高问题的线性回归实例。


图5.8 MNIST数字识别TensorBoard输出图像展开.jpg

图5.8 MNIST数字识别TensorBoard输出图像展开


此书第六部分阐述了强化学习的基本原理,以一个简单的九宫棋为例讲述了强化学习的基本算法:Q学习算法。随后介绍了AlphaGo的基本架构,其赖以常胜不败的监督学习策略网络、强化学习策略网络和估值网络等组件的工作原理。最后介绍了深度学习的一个有趣应用:画风迁移,以飨读者。以上所有内容均节选自书籍“《深度学习入门与实践》龙飞 王永兴著清华出版社”。


图6.3 弈棋决策树状搜索过程.jpg

图6.3 弈棋决策树状搜索过程

 

以上内容节选自清华出版社《深度学习入门与实践》龙飞 王永兴著



内容来源:书问