近年来,人工智能浪潮在全球兴起,正在对人类社会造成深刻影响。在中国,人工智能也受到高度重视,中国人工智能技术发展与应用,已经处于世界前列。2017年7月国务院印发《新一代人工智能发展规划》,将进一步推动中国人工智能的发展,了解和掌握一定的人工智能知识和技术,将成为中国广大群众的需求和必备的技能。鉴于这样的背景,向大众普及人工智能知识是长期而重要的工作。
陈宗周著的《AI传奇:人工智能通俗史(精)》以讲故事的方式叙述人工智能发展的简要历史,通俗介绍人工智能关键技术发展过程和作出贡献的重要人物,展现人工智能应用现状并前瞻未来,特别关注中国人工智能的现状与未来。全书通过引人入胜的故事,让人了解人工智能发展概貌和广阔应用前景,增强对人工智能这一技术革命中新生事物的兴趣和自觉应用的意识。
陈宗周著的《AI传奇:人工智能通俗史(精)》是希望在回顾人工智能传奇历史、叙述人工智能现状和未来的同时,也对中国人工智能的现在和未来有所介绍和展望。希望为读者提供一个简短的、通俗而有趣的人工智能发展史读本。希望大家在阅读这一读本的同时,把自己和人工智能的现在与未来建立起亲密友好的联系。
赞誉
序言
前言
第一章 春暖花开——人工智能复兴
旷世棋局的幕后英雄
人机博弈之战
AI大潮席卷
各国政府的应对策略
第二章 酷暑与寒冬——人工智能60年艰难历程
1956年达特茅斯会议与AI诞生
初期的繁荣与乐观
遭遇计算能力瓶颈
复兴与再度冰冻
20年寒冬
第三章 杰弗里·欣顿——突破人工智能关键技术的人
实习生培训班的老人
人工神经网络道路崎岖
寒冬中的坚持
深度学习登场
第四章 助飞的双翼——深度学习成功的秘密
不是只要有好算法就能成功
疯狂冒险家黄仁勋与
“拼命三郎”李飞飞缔造Im
让深度学习升华
第五章 数据魔方——数据科学崛起
华尔街数据争夺战
AI眼中的历史与未来
造就神奇的数据科学
来自大数据的挑战
异军突起的数据可视化
硬币的另一面
第六章 机器在聆听——语音识别的历史性突破
人类的美好梦想与历史探索
统计语言学打破沉寂
剑桥语音的黄金十年
技术高门槛与垄断
深度学习带来历史性突破
广阔的创新领域
第七章 让霍金倾谈——语音合成创造奇迹
机器制造“完美的保罗”
语音合成的漫漫长路
科大讯飞,一名在校生书写的传奇
语音交互大战打响
第八章 重建巴别塔——机器翻译拆除语言樊篱
机器翻译崭露头角
冷战催生的机器翻译
语言的规则太复杂
统计翻译成为主角
见证历史的活样板
科技巨头的竞技场
第九章 第二双眼睛——计算机视觉大放异彩
央视节目引起热议
计算机视觉前史
学科奠基人戴维·马尔
走上快车道
中国力量崛起
谷歌猫与计算机视觉的未来
第十章 忠实的朋友与助手——形形色色的机器人
美的收购“德国国宝”
机器人的前世今生
现代制造业与工业机器人
服务机器人大合唱
巨大的冲击波
第十一章 飞翔的机器——无人机的广阔天地
无人机“黑飞”事件
漫长发展史
汪滔与大疆
给“硅谷狂人”上了一课
广阔的应用领域
微小型化与集群应用
无人机的未来
第十二章 智能交通革命——自动驾驶的梦想与现实
收购狂潮158自动驾驶概念与无人车的历史
伊拉克战场引发的无人车挑战赛
民用研究趁势而上
“狂人”马斯克来了
不同的声音——无人驾驶还需60年
无人车畅想曲
第十三章 无形机器人——无处不在的虚拟机器人
一场官司的背后
什么是
Bot今昔
创业的新机会
虚拟机器人大显神通
未来的竞争利器
第十四章 终身学习时代来临——人工智能塑造新人生
教育史上的“一场数字海啸”
机器人给考试评分
高考机器人亮相
AI带来个性化教育
超越大学,终身学习
第十五章 电脑神医——精准医学带来的福音
AI挑战医生
破解医学影像处理难题
手术机器人
精准医学应运而生
新药研制走上新路
时刻不离的远程AI医生
第十六章 二十三条军规——对人工智能威胁论者的回答
乌镇内外
AI威胁论为什么是错的
今天的AI可能还处于胚胎阶段
乐观的信号出现
未雨绸缪的“二十三条军规”
第十七章 美丽新世界——AI的未来
AI2.0新篇章
通用AI的追求
深度学习的未来
挑战摩尔定律
向人脑学习
人类的新征程
第十八章 中国传奇正在书写
AI名人堂里来了中国人
国际学术会议因春节改期
美国媒体关注中国
开放环境创造双赢
美国政府的新担忧
创业大潮风起云涌
宏伟的国家AI发展蓝图
不是只要有好算法就能成功
深度学习是机器学习领域的分支学科,而机器学习(Machine Learning,ML)这门AI中的交叉学科,历史与AI同样悠久。机器学习思路是让计算机自动学习相关知识并解决实际问题。实现机器学习有很多方法,深度学习机即深度神经网络(Deep Neural Networks,DNN)是其中的重要方法之一。
AI、机器学习、深度学习之间的关系可以这样简单概括:AI是目的,机器学习是方向,深度学习是路径。
机器学习、神经网络都不是新概念,深度学习虽然严格说也不是新概念,但它在2006年被欣顿等重新包装推出时,的确有很多创造性的新思想和算法,让机器学习焕然一新。但是,AI的历史告诉我们,不是只要有好算法就能成功。
比如,深度学习用统计学方法巧妙处理深度神经网络数据的权重,把概率上相对近似度高的数据合并处理,大大降低了数据的维数,也就是降低了复杂度。由于这项关键技术,欣顿把自己构建的深度神经网络也称为深度置信网络。但是,即使大大降低了数据的维数,涉及的数据和计算量依然惊人。
神经网络模仿人的大脑,用学习的方法获取准确知识并用之解决问题。最初的神经网络只有单层,这样简单的神经网络当然不实用。由于人脑的学习过程实际上是分层进行的,人工神经网络后来又发展成多层神经网络,在输入层和输出层之间加上隐层,这就是三层神经网络。隐层还可以不断增加,达几层、几十层或者更多。夺得2015年ImageNet图像识别竞赛冠军的微软ResNet系统,就是152层的深度神经网络。
深度神经网络可以使学习一层层深入,这使得深度神经网络或深度网络有时也成为深度学习的代名词。从常识上看,有深度固然好,但随着神经网络层数增加,计算量也变得无比巨大。
又如,深度学习中涉及的数据需求,也会随着深度神经网络系统的规模增加而大大增强。
就像人类学习需要各种学习材料、学习场景一样,机器学习也需要这些,只不过机器需要的学习材料、情景都必须数字化。
也像人类学习可以分为有老师的学习和无老师的学习一样,机器学习可以分为监督学习和无监督学习,监督学习必须使用经过标注的数据,无监督学习使用的数据不需经过标注。
神经网络本质上是一个数据驱动模型,需要提供数据让机器去学习,然后根据学习的结果不断调整、优化模型中的参数,达到模型收敛,也就是达到预期学习效果。这一过程叫训练。
一个神经网络系统一般需要三个数据集,即训练集、开发集、测试集。训练集规模越大、匹配度越高,训练效果也就是学习效果越好。
如果神经网络系统的训练数据太少,会出现“过拟合”。这个专业术语的意思是学习结果太针对特定情景,不能推广。而学习结果能广泛适用,则称为“泛化”。正像人类学习能举一反三是因为掌握了大量知识一样,机器学习也需要大量、多样化的数据。
形象地说,机器学习需要大量多样化的数据“喂”进机器,“喂”进的数据越多,质量越好,学习效果越好。
欣顿想了很多办法来减少对监督学习的需求,因为这意味着大大减少工作量和提高训练速度。他的创新思路是将无监督学习和监督学习结合使用。首先让机器自己进行无监督学习,即自动处理没有经过标注的数据,进行逐层预训练,使得在利用反向传播算法对网络进行全局优化之前,网络参数能达到一个好的起始点,从而在训练完成时达到较好的局部收敛点。最后阶段进行监督学习,即用经过标注的数据进行训练,这样大大提高了训练的速度。欣顿形象地比喻说:“想象一下小孩子,当他们学着辨认牛时,并非需要去看几百万张妈妈们标记上‘牛’的图片,他们仅仅是自己学习观察牛的样子,然后问道‘这是什么?’妈妈会说‘这是一头牛’,他们就学会了。”
这是深度学习巧妙的学习过程,但即使有这些发明,深度学习也必须在计算能力大大增强和海量数据出现的情况下才能充分发挥作用。
此外,如果要使神经网络系统表现得更加优秀,会涉及一个有趣的术语,即鲁棒性(Robust),这个英语术语的音译非常传神,让人一望可知含义是粗壮、稳定。怎么提高神经网络系统的鲁棒性呢?常用的方法之一是通过人为添加一定的噪声来进行训练。就好比军人在平时训练中要增加一些恶劣场景来提高训练水平,以提高实战能力一样,在神经网络中,为提高鲁棒性来添加噪声,会增加数据量和多样性,同样提高了对计算能力的要求。
P42-45
下一波浪潮和AI的未来
今天大家都觉得AI“大风”来了,必须赶快前进不要掉队。但是如果冷静想想,AI还是面临很多挑战。
研究方面的挑战更大一些。国务院2017年7月印发的《新一代人工智能发展规划》提出:我国到2030年人工智能理论、技术与应用总体达到世界领先水平,成为世界主要人工智能创新中心,智能经济、智能社会取得明显成效,为跻身创新型国家前列和经济强国奠定重要基础。这对研究工作提出了很高的要求。同时,中国工程院也发布了新一代人工智能发展报告。新一代人工智能也称为AI
2.0,我国的人工智能发展正从AI1.0向AI2.0过渡。
AI现在的主要缺陷或者说不足是在机器学习上。深度学习即深度神经网络是机器学习的一种方法,这种方法确实可以解决很多问题,在实践中也取得了很大的成功。但深度学习也要发展。我去美国开会时,马里兰大学一位很知名的AI专家调侃说,现在“深度学习有深度而无学习”(DeepLearning——DeepYES,LearningNO)。因为这样的“学习”严格说不是学习,而是训练,是用大数据在训练一个数学模型,而不是真的通过学习获得知识。
更大的问题是人们不知道机器学习是怎么解决问题的。在神经网络里,有很多东西没有办法定性和解释,这是一个比较难的问题。若要解决这个问题,AI可能又会迎来一波大浪潮。
所以,围绕机器学习的基础性研究是AI领域很重要的研究内容,很多研究人员包括我知道的两位图灵奖得主都在进行这方面的研究。而美国国家科学基金会(NSF)从2016年开始对简单使用深度学习去解决问题的研究已经不再支持,但对于机器学习原创研究工作仍然大力支持。我国国家自然科学基金委员会(NSFC)也会在这方面有很大的支持力度。
对于未来,我们需要思考AI现在做了多少事,未来还有多少事需要做。
事实上,我们现在所解决的AI问题还是很小的一部分。AI涉及的问题可以分为四部分。
第一部分是可统计可推理的AI问题。什么是可统计?只要数据多了,通过统计就可以找到规律。什么是可推理?知识之间的逻辑关系、因果关系能归纳出来。可推理既可能是基于大数据的推理,也可能是基于符号的推理。现在对这部分AI问题的研究和应用已经逐步成熟,因为既有深度学习,又有经过多年研究的逻辑演算基本算法。这一部分研究成果在工业界已经可以使用,可应用于机器人以及各种各样的知识决策系统。
第二部分是不可统计可推理的AI问题。因为数据不完备、过于稀疏,或者难以对数据的特征进行描述,这样就无法进行统计,但是可推理,可以写出正确的规则。这部分AI问题靠大数据解决不了,只能靠传统的逻辑和规则来处理。
第三部分是可统计不可推理的AI问题。有大数据,通过大数据能统计出规律,但是语言表述逻辑和因果关系相当复杂。这一部分AI问题中有些用神经网络可以解决,但用推理的方法很难解决。这方面的曙光已经初现,但是也需要更多的突破。
第四部分是不可统计不可推理的AI问题。这是最难的AI问题,未来这方面难以很快有作为。为什么?因为这类问题连我们自己也说不清楚。比如说人类有很多顿悟,这些顿悟能通过统计证明它的产生吗?不可能。能通过推理证明它的产生吗?同样不可能。什么人在什么环境下突然想明白一件事,这个问题机器解决不了,因为没有模型和数据。所以这类问题是未来机器人不可能涉足,不可能胜过人类的。
通过分析这四部分AI问题,可以看出第一部分的研究比较成熟,已经能够成功应用了。第二、第三部分正在突破,是AI1.0向AI2.0过渡的主要研究内容。也不难看出,未来AI会在哪些方面超过人以及在哪些方面不可能超过人。第四部分的AI问题在短期内难以突破。
AI给全社会尤其是自动化、机器人领域带来了极大的发展机遇。过去这几十年,我们经历了几波比较大的浪潮。第一波是PC浪潮,给信息领域带来了颠覆性影响。之后是互联网浪潮,成就了一大批互联网公司,如谷歌、百度。紧接着是移动互联网的新一波浪潮,苹果、华为等都是乘着这波浪潮成长起来的公司。下一波是什么?一定是AI,一定是新一代的AI公司。
未来的机器人什么样?现在的机器人的绝大部分行为是事先设计出来的,我们把它叫作DesignedRobot,如机器人的前进、拐弯都是事先设计好的。未来的机器人应该叫学习机器人——LearningRobot。机器人生产出来以后,它不知道要干什么。你训练它干什么,它就干什么。就像小孩一样,小孩出生时能说他将来是数学家、物理学家、技术工人、农民吗?他什么都不是,但又什么都可能是。未来机器人也应该是生产出来时什么都不是,通过你教它和它自己学习,它也可能什么都是。教它开车它就能开车,教它上流水线操作它就能上流水线操作。这一天一定会到来。
怎么让未来的机器和系统具有与人类同样的知识能力和水平?这是最大的问题。现在机器和系统的大部分知识是软件知识。对于一个机器或系统,我们会给它现成的软件和大数据集并对它进行不断的训练,让它不断与人聊天、对话,不断调整反馈,逐步成熟,这是现在的情况。
未来的机器和系统需要的不仅是现成的软件知识,而且应该具有开放性获取知识的能力。人类之所以一直在进步,是因为知识本身是开放的,我们得到了知识,然后教给学生,或写成书籍贡献给社会,在这个基础上,别人再去添加新的知识,社会得到这些知识之后就会不停地进步。所以人类社会一定是开放的,如果不开放,这个社会就不能进步。这样的道理同样适用于AI,适用于机器人。
未来人类和未来AI,一定会在开放环境中共同前进。
高文
北京大学信息科学技术学院教授
中国工程院院士
中国计算机学会理事长
国家自然科学基金委员会副主任
我在今年的两会期间,作为全国人大代表提交了一项建议,呼吁把人工智能列入国家战略。中国在移动互联网的领先优势,通过云服务和大数据很快会转换成人工智能的优势。人工智能列为国家战略,将极大推动整个产业进步和整个社会的进步。人类对人工智能的思考从来没有中断过,《AI传奇——人工智能通俗史》一书记录了人类在人工智能领域的伟大历史进程,也让我们对未来人工智能将如何进一步改变世界更加充满憧憬与期待。
——雷军(小米公司创始人、董事长兼CEO)
人工智能是时下热点,相关读物数不胜数,难免良莠不齐。本书好就好在雅俗共赏。作者是资深媒体人,本书既坚守了专业的严谨,又如书名所示,通俗易懂,不乏生动的细节和轶事。这本全景式描绘人工智能发展史的著作,无疑有助于人们更准确地认识和把握未来技术、经济和社会发展趋势。
——胡舒立(财新传媒总编辑)
陈宗周先生当年创办《电脑报》,引领中国信息文明启蒙之先。现在他又推出人工智能新著《AI传奇——人工智能通俗史》,前瞻依旧,文采斐然,人文情怀浓浓,是我们进入智能时代的通俗入门读本、难能可贵的参考。
——方兴东(互联网实验室创始人、汕头大学国际互联网研究院院长、全球互联网口述历史项目发起人)
AI是现今时代最有知名度的名词,但大众对AI的前世今生和未来却很朦胧。历史让人睿智,历史预示未来。《AI传奇——人工智能通俗史》一书让人对神秘AI豁然开朗不少,对于"大众认知AI和年轻人引导AI未来"将很有裨益!
——欧阳宏伟(浙江大学爱丁堡大学联合学院院长、再生医学专家)
在一些人眼中,人工智能(AI)是改变21世纪的重要力量;在另一些人眼中,人工智能有可能打开潘多拉的盒子,其危险程度甚于核子武器。人工智能究竟是什么?它将给这个纷繁变化的世界带来怎样的影响?为什么直到2016年它才成为大红大紫的热门,炙手可热的技术?本书是回答这些问题的最佳入门读物。陈宗周之于跌宕起伏的《AI传奇——人工智能通俗史》,犹如尤瓦尔·赫拉利之于波澜壮阔的《人类简史》。
——朱也旷(作家、批评家、《南方周末》高级编辑)
对于AI大浪,既不应做鸵鸟不听不闻敬而远之,也不应做鹦鹉不管不顾盲目附和。陈宗周老师的这本新著不仅充分展现出人人心中都有、个个笔下皆无的高超境界,更让每一个希望在AI时代做弄潮儿的有志之士了解过去,展望未来。
——林军(科技媒体雷锋网创始人)