
王海峰是百度首席技能官,也是上海人工智能战略咨询专家委员会成员。在2019国际人工智能大会举行之际,王海峰承受解放日报·上观新闻记者专访,共享了他对人工智能热点话题的观点。
问:您以为,人工智能技能意味着什么?
答:众所周知,自18世纪60年代起,人类阅历了三次工业革命,别离以机械技能、电气技能和信息技能为中心驱动力。当今,咱们正身处第四次工业革命浪潮之中,而人工智能技能则是这次工业革命的中心驱动力气。人工智能技能将进入到人们出产日子的各个旮旯,人工智能正将人类社会带入智能年代。
问:自从“人工智能”一词为大众所了解,有关“人工智能是否会代替人类”的争议就一向不断。您怎么看待这个问题?
答:当时,部分大众对人工智能知道缺乏,存在必定的惊惧心情,以为人工智能会代替人类的作业、会要挟到人类。所以,让大众对人工智能有正确认知和合理等待,是人工智能从业者,也是全社会需求处理的问题。
现在的人工智能技能全体而言依靠大数据、大模型和大的核算才干,这之中仍旧有许多问题需求处理。现阶段,人工智能在特定使用、特定场景上的才干超过了人类,但想全面到达乃至逾越人类还有很长的路要走,尤其是在言语与常识等认知技能上,还有很大的开展空间。
人工智能的使命不是代替人类,而是为人类服务。人工智能能够比人类更超卓地完结某些使命,比方重复性、根底性或许纯膂力作业;可是也有许多才干机器是不能代替人类的,比方科学家、工程师、艺术家等需求创造性的作业。
未来,人类将更多地充任管理者的人物,机器仅仅辅佐人类做出决议。全社会关于人工智能应抱有正确的知道和预期,不能过高,也不能害怕,这样才干更好地拥抱人工智能。
问:您更垂青哪些范畴的人工智能探究?
答:想要务实地推进人工智能开展,首要要看到人工智能开展过程中面对的时机和应战。我以为人工智能范畴的探究,要从理论根底、使用技能、工业根底、使用体系四个层面一起打开。
在根底理论层面,小样本、低能耗、可解说是人工智能现在面对的最大应战。人工智能,尤其是深度学习的开展离不开大数据和大的核算才干,但强壮算力的背面,是巨大的能耗在支撑。另一方面,深度神经网络的成果很难解说,难以赋以物理含义。现在在这方面的探究包含搬迁学习、图神经网络、对立生成网络以及符号与神经网络的结合等等。因而,人工智能理论研讨要探究怎么让人工智能像人类相同、完成小样本学习、能耗低,且真实地被了解。
在使用技能上,感知技能与认知技能仍然是未来的重要方向,尤其是认知技能。与听觉、视觉相关的感知技能,在深度学习的这一波盈利里得到了巨大的开展。但自然言语了解和常识图谱等认知技能,还有许多问题亟待处理。一起,交融感知与认知技能的多模态深度语义了解会进一步开展。
工业根底层面,软硬结合很重要,深度学习结构和AI芯片逐步成为人工智能开展的新趋势,也是新的工业时机。别的,跟着5G的到来,边际核算也成为人工智能开展不行忽视的一环。
在使用体系层面,多技能归纳使用、结合场景的体系性立异至关重要。跟着人工智能与各行各业的交融越来越深化,真实落地的工业使用往往是多种技能的归纳使用,需求结合特定场景、事务需求及数据特色,完成体系性的立异,才干切实为现有事务提高功率,或许开展新的事务形式。
总结而言,人工智能体系和生物、和人相同,是不断进化的。人工智能体系在使用场景中,与环境、用户相互作用,不断发生新数据,不断学习,沉积常识,改善算法,越来越强壮。
问:在百度的人工智能研讨中,是否对这四个层面有所触及?
答:百度从2010年开端人工智能技能布局和根底才干堆集,2016年9月正式发布的百度大脑是百度人工智能技能多年堆集和事务实践的集大成。在百度大脑的研制和事务实践中,对理论根底、使用技能、工业根底、使用体系均有触及。
现在,百度大脑现已构成完好的技能体系,并全方位敞开人工智能技能才干。其间心技能进入“多模态深度语义了解”阶段,能够对文字、声响、图画等多模态的数据和信息进行深层次多维度的语义了解。本年7月发布的百度大脑5.0,AI算法、核算架构和使用场景交融立异,成为“软硬一体AI大出产渠道”,打通了人工智能工业化使用落地的全流程,从深度学习技能及渠道到通用AI才干、使用技能计划,再到定制化模型开发渠道,以及终究的布置和集成,完成了 AI 技能的标准化、自动化和模块化,深度赋能开发者,加快工业智能化进程。
问:能否请您以百度大脑5.0为例,扼要介绍一下百度人工智能技能的开展及使用?
答:百度大脑5.0在语音、视觉、常识图谱、语义了解等中心技能层面继续立异,坚持国际抢先水平;在算力层面,完成面向人工智能的核算架构,发布AI芯片;一起不断完善和晋级深度学习开源敞开渠道百度飞桨,下降人工智能技能门槛,促进人工智能使用落地。
比方在语音辨认方面,成功将注意力模型使用于大规模线上语音辨认体系,精确率进一步提高。该技能现已在智能音箱和语音输入法等产品中使用,完成高精准的中英文混合语音辨认。
在语音组成方面,风格搬迁技能把声响中的音色、风格、情感等不同元素解耦别离,独立组合,灵敏操控组成的声响;一起只需录制20句话,就能够制造一个人的专属声响。
自然言语了解方面,结合常识和语义了解,发布可继续学习的常识增强语义了解结构ERNIE。首要结合先验常识和海量数据构建预训练使命,然后学习其间的言语、实体、联系、常识等等各种信息,模型才干能够继续增强,提高作用,快速使用。
百度大脑5.0还在机器同传范畴取得了打破。归纳联合词向量解码、语篇翻译模型等新技能,完成高精确、低时延的机器同传,并发布了语音到语音的机器同传体系“DuTongChuan(度同传)”以及全球首个中文-英文讲演场景语音翻译数据集(BSTC)。有时机试用一下就能发现,百度的机器同传作用现已比美人类舌人。
以上仅仅百度大脑5.0在语音和自然言语处理范畴的部分技能开展及使用。全体上,百度大脑布局完好,中心技能抢先。一方面,百度大脑是百度事务强有力的技能支撑;另一方面,百度大脑也是全方位敞开的,助力合作伙伴和开发者,加快人工智能技能落地使用,赋能各行各业转型晋级,促进社会经济革新。
百度查找、信息流、百度地图、百度输入法等产品根据百度大脑的AI才干变得愈加智能。比方,百度智能查找能够更深化地了解用户需求、高效地连接人与信息、提高用户体会;百度地图,充分利用百度大脑的技能优势,成为业界智能化水平最高、搭载的人工智能技能最强最丰厚的地图,完成了全流程AI化数据出产,为用户供给道路规划、智能语音帮手、步行AR导航、实时路况、个性化引荐、智能旅行导览等智能出行服务。
还有,根据百度大脑技能才干,百度智能家居、自动驾驭等范畴处于全球抢先水平,具有智能语音交互敞开生态“小度帮手(DuerOS)”,以及智能驾驭敞开生态“Apollo”。此外,面向企业及开发者的智能云核算服务渠道“百度智能云”,为各职业智能化转型供给处理计划,促进数字我国建造。
问:关于当下人工智能的研制和使用状况,您有什么主张或定见?
答:从研讨的层面看,我以为人工智能的根底研讨还相对单薄,而根底研讨是关乎人工智能中心竞争力的要害范畴,亟需加强。从使用层面看,我觉得要防止对人工智能希望过高。眼下,部分工业、本钱、大众等抱有人工智能“无所不能”的主意,有很多资金涌入人工智能范畴;但以当下的技能条件和环境,不是一切的工业都能用人工智能处理中心问题,希望过高会给人工智能工业开展带来泡沫化危险。从另一个视点来说,技能也不是要做到100%的精确率才干使用,作用到达必定程度,就能够投入使用,让人工智能技能在场景化的使用中继续进化,一起更深化地推进人工智能的工业使用落地。所以在本年的百度AI开发者大会上,咱们屡次提及的要害词之一便是“工业智能化”,百度也会更重视技能和不同职业的融会贯通,促进工业智能化开展。

