在6月8日举行的百度联盟峰会上,百度再次把重点聚焦在了人工智能。无论是率先登场的李彦宏,还是随后出场的向海龙,他们演讲的核心事实上都是人工智能。在我看来,百度的联盟伙伴和互联网企业应该细细品味这些演讲内容。因为,以人工智能为代表的互联网下半场已经向我们走来。
互联网的上半场是量的积累
1995年,通讯科学家格雷格·布朗德在美国著名的科技杂志《连线》上说了这样一句话:“可怕的并不是电脑将在2008年与人类智商相当,而是电脑智商的指数曲线将继续上升、上升,再上升。”当然,现在是2016年,计算机在整体上,还未能表现出接近人类智商的水平。然而,在设定好规则的竞技类游戏中,人工智能却已能够击败人类顶尖高手——阿尔法狗与韩国棋手李世石的对弈结果证明如此。更加可怕的是,人工智能的复杂程度还在呈现指数级别的增长,而人类大脑的容量数千年已经没有变化。
关于人工智能的讨论,互联网业内已经非常火热。华为任正非最近在全国科技创新大会上表示,未来二三十年,人类社会将会进入一个智能社会,其广度和深度我们可能现在都想不到。李彦宏也在多个场合表示,百度正在大力投入以机器学习、人工智能为代表的新领域,每年投入数十亿计的研发支出。以无人驾驶为例,人工智能应用在车辆驾驶上,能够实现目前司机能够做的事情,能够理解、明白道路状况并作出选择,极大解放了人。
大家不要觉得无人驾驶是很遥远的事,百度目前的无人驾驶技术,已经在安徽省芜湖市和贵州省贵阳市开始试点,专门圈出来一个区域,这个区域里面不允许有人车行驶。笔者本人也曾经乘坐无人驾驶汽车在上海市中心核心地段行驶,全程非常安全。
在我们这个已经发展了数十年互联网业态的国家,在电子商务、搜索、社交软件等方面,信息革命正在呈现出越来越智能化的特点。在互联网发展的上半场,通过计算机终端(包括笔记本、智能手机等),互联网将人、物、计算机连接在了一起。互联网将人最纯朴的需求搬到了网上,同时将物的供应也搬到了网上,并在需求对接供给的同时产生了大量的数据。人人互联形成网络社交、人物互联形成了电子商务、打车出行、外卖上门等。随着现实社会越来越多的方面,不仅仅是衣食住行被在线化,互联网所积累的信息量也在大幅增长。
这个信息量有多大呢?根据加州大学伯克利分校的两位经济学家瓦里安和莱曼的估计,2000年,信息的生产总量大概是在1.5EB字节。他们用一种方法测算了之后三年的全年信息总量,数据是3.5EB,这意味着每年的信息增长率是66%!通过对科学论文、出版期刊、邮件数目的增长所作的研究,科学家发现信息的增长一直指数增加,从未减缓。我们已知一个人DNA中储存的信息总量是300EB,也就是说,以上述增速十年时间,人类社会产生的信息就已经超过了一个人的DNA。如果这么推算下去,搬上互联网的这些信息,在数十年的时间里,其复杂程度正在或已经超过了一个智慧人类所携带的所有信息。
从量变到质量的互联网下半场
这些海量信息的积累正在导致一个从质变到量变的结果,可能大家还没有感觉到。然而,在一些细节中,互联的计算设备正在把它智慧化的一面表现给大家。还是以今年百度联盟峰会上呈现的技术为例,百度的内容发布平台正在根据不同的用户特点推送不同的内容,搜索引擎展示给每个用户的搜索结果都不一样。比如搜索明星“宋茜”,如果用户不是宋茜的粉丝,他对宋茜的相关信息不熟悉或者不关注,那么他搜索的结果将是左面的效果,包含宋茜百科等基本信息。相反,如果用户是宋茜的粉丝,将优先出现明星行程、粉丝关注、微博等丰富的内容,满足粉丝的追星需求。
在传统的应用中,用户通过搜索得到的信息是零散的、重复的、不规律的,百度通过新的搜索技术和多个应用平台的结合,能够帮助用户提高信息获取的效率,并一站式满足用户的诉求体验。基于不断积累的数据和不停升级的强大计算能力,计算机正在预测用户行为并根据预测行动。
这个计算机必须是联网的,它具备分布式计算的功能,并且能够通过网络获取外界信息并加以处理。一个可以直接预测的结果就是:世界上快速增长的计算设备正在通过互联网,形成一个能够自我预测、自我行动、自我实现的超级计算机——也就是我们所说的人工智能。
人工智能将如何重构互联网
为什么说互联网的下半场是人工智能呢?互联网的上半场,已经积累了足够产生质变的进步。李彦宏在今年的峰会上就提到,人工智能已迎来“井喷式”创新,将推动互联网进入“第三幕”。这也意味着,接下来,互联网行业将在人工智能领域展开竞争。
事实上,人工智能技术已经在改变互联网。以最简单的搜索、电商、社交来看,人工智能将帮助用户更快搜索到目标,购买到商品,千万人群中寻找到想连接的对象。以搜索为例,人类之间的日常交流主要是通过视觉和听觉进行的,语音和图像的交互毫无疑问比文字书信更流畅、更自然。所以,李彦宏曾在2014年百度世界大会上做出预测:五年内语音和图像搜索比例有可能突破50%。而百度此前发布的2015财报也为这一预测提供了例证:在核心搜索方面,语音、图像搜索量增长迅猛,同比上涨超过一倍。可以说,用户对于自然的人机交互方式需求显著,新的搜索习惯正在养成。
所有的这些,事实上源于百度在人工智能上一项显著进展,即基于深度学习的Deep Speech在噪音环境下的语音识别效果超越了谷歌。这一研究成果在“互联网女皇”玛丽·米克尔的报告中也被提及,该项技术已成功应用到百度语音搜索上。目前,百度语音搜索已通过人工智能做到了“听”和“说”,而且还尝试完成人类复杂的行为——沟通。集成语音识别、语义理解、深度问答、知识推理、多轮对话、智能摘要、情感分析、语言生成、语音合成等能力于一身后,相较于键盘输入,百度语音搜索已经能够满足用户的多种复杂需求,引领人机交互迈入听说时代。
可以预见,未来,随着智能技术不断发展演进,人机交互也会越来越贴近人类自然的交流方式,更加智能化和多样化的交互方式影响的绝不仅仅是搜索领域,内容、通讯等各个领域都将迎来新的“声音的战争”。
人工智能在无人驾驶、机器人方面也正越来越成熟。百度的语音识别技术帮助计算机获得了自然语言的拼写能力,它设计并研发的度秘机器人,就代表了一种智能的人机交互形态。度秘综合了语音、图像、自然语言处理等技术,能够与人进行多轮的、智能的交流,提供所需要的信息与服务。此前,度秘机器人在肯德基智能餐厅上岗就是一个很好的案例。当然,度秘能做的不仅仅是为我们点餐。据说,它还能为我们订票、读新闻、报天气,甚至给我们唱歌,陪我们游戏。
所以,我的看法是,任何互联网企业,最终都将变成人工智能企业。对于人类而言,无论是在家还是出门在外,只需要携带一个便携式的人工智能硬件,就能够解决生活和工作中所遇到的所有问题——至于你的需求是搜索、购物,还是社交,这些分类都已经不再重要。这正是我从百度联盟峰会上看到的未来!