尊敬的各位来宾、各位专家、各位学者,各位远道而来的朋友们,大家下午好!很谢谢大家参加本次大会,去年的11月份我们在这边举办了第一场光谷国际AI产业论坛,今天到场的也有很多去年来过的老朋友们,非常
非常感谢大家参加本次大会,去年的11月份我们在这边举办了第一场光谷国际AI产业论坛,今天到场的也有很多去年来过的老朋友们,很谢谢大家。今天我给大家伙儿一起来分享的主题是《从感知到认知自然语言处理领域的机会与未来》。
过去几年人工智能的发展能够说是日新月异,很多人认为人工智能可能是下一个新的时代,不管是我们的预测机构还是预测家,都非常看好人工智能的发展,包括我们的政府也积极拥抱人工智能,还有巨头企业,包括谷歌、百度、腾讯,他们都在积极的布局人工智能。当然,阿里也不例外,阿里集团副总裁、学术委员会主席说阿里一直在布局人工智能,而且他说所有的公司都应该拥抱AI。
很多人会问,人工智能为什么这么受追捧,而且被认为是下一个跨时代的技术?如果我们从整个产业的发展来看,我们经历了互联网、移动互联网,20年前互联网的发展成就了BAT这样的企业,10年前我们迎来了移动互联网,像滴滴、小米这样的大公司也在这一波成长起来。然而,互联网和移动互联网是否还具有持续发展的动力?如果我们从流量来说,互联网流量的红利现在正在慢慢的消失,如果从事这个行业成本会非常高,移动互联网也是如此,目前手机保有量达到13亿以上,这方面的成本非常高。互联网解决了信息不对称和连接的问题,但没从根本上解决这一个行业的问题。我举两个例子,现在我们有一些互联网翻译平台,翻译平台可以对接用户和翻译机构或者翻译专家的需求,但是翻译还要人去做,所以它的成本仍然很高。现在,人工智能翻译最近几年非常火,至少是部分解决了翻译行业的一些问题。
医疗,过去几年像春雨医生这样的互联网医疗平台也是希望可以对接患者和一些知名专家,但是知名的医生和专家都是非常稀缺的资源,哪怕是三甲医院平时挂专家号都是排队的,他自己医院的患者都应接不暇,所以他没有更多的时间应付网上的患者。所以现在人工智能,特别是像医疗、影像、人工智能辅助诊疗系统,可以辅助或者替代医生做一些诊断,可以真正的解决医疗行业的一些问题。所以AI可以替代一些专业技术人员,能大大的提升社会生产力,能够解决一些供需不平衡的问题,减少相关成本,提高效率。所以AI在金融、医疗、交通等行业会带来更大的社会价值。
人工智能的发展主要有三个阶段,第一是计算智能,这一块就是20年前IBM的深蓝打败当时著名的象棋冠军,当时是花了非常大的能力做这件事情,当时挑战围棋的难度非常大,因为围棋的可能性非常多,要穷其这种可能计算能力是很强大的,所以20年后阿尔法GO打败当今的围棋高手,这标志着计算智能慢慢走向成熟和成功。在感知智能这一块,最近几年在语音识别、图象识别,每过一段时间准确率都刷新,这也得益于深度学习技术的发展。
被我们认为最难的一块就是认知智能,这也是让机器人真正的像人类一样会思考、会推理、会学习的能力,目前被公认最好的或者最领先的平台是IBM沃森平台。我举一个例子看一下感知智能和认知智能,我们拿一个格外的简单的例子,如果我们和机器人,或者说我们跟一个虚拟的机器人也好,硬件机器人也好,说一句话,比如说帮我放一首周杰伦的歌,首先语音会通过语音识别转化成文本,之后做一系列的工作,包括分词、语义识别、意图识别,最后我们到这个歌曲库里面把歌找出来、执行出来,放给用户,左端就是语音识别感知智能,右边这块是自然语言的理解,是认知智能。现在BBS在研究分析,未来最被可能替代的十个职业里面,很多都是和语言相关的,这也就是说后面要使用到认知智能的技术才能很好的解决这样一些问题,所以它需要做到两点,第一是必须理解业务,第二需要做沟通和多人对话。认知智能是自然语言理解的基础,被认为是人工智能皇冠顶上的明珠,它分为长文本理解和短文本理解,长文本理解包括舆情分析等,短文本理解未来几年有非常大的发展的潜在能力。我们也有聊天机器人,因为我们后面跟所有的设备、硬件、机器人、汽车、家居等交流的时候,都是通过文化式的问答来完成的。聊天机器人未来有非常好的增长趋势,我们这一块包括个人用户和企业用户,个人用户有各种各样的智终端,包括我刚才提的智能机器人硬件、消费电子等等,它的未来增长会从3.9亿到2021年的18亿,企业用户从1.55亿到8.43亿,相应的收入会提到158亿美金。这也是一个非常好的增长前景。
我们看一下传统的产品和智能升级带来的巨变,今年的智能音响很火,有些人说音响可能是传统音响的升级,或者迭代,但是也有人说这个音响是一个跨越式的,或者跨时代性的产品,是一个破坏性的创新。我们如何理解这样的产品呢?我们的角度来看一下苹果的手机,手机在几年前,从传统手机到智能手机的升级,传统手机只有一个功能就是打电话,通过触摸技术、多点触碰技术,加上手机的操作系统生态、内容,构建了智能手机的完整体系。以至于智能手机带来了数十万亿的产业规模。而我们的音响其实一样,最传统的音响只是用来听歌,我们通过语音识别、语义理解智能化的交互、升级,音响后面也会有一系列的生态,包括以后手机里面所有的APP的功能,未来都能够最终靠语音来实现、唤醒,比如说听歌、问天气、查股票、听各种新闻,还有在上面购物、点外卖等等,所有的动能都能够最终靠语音的方式实现。后台还连接了非常多的内容,包括教育的、音乐的、FM电台的相声等等内容,还有音响能控制智能家电,所以它也被认为是智能家庭的入口。所以,现在很多巨头都在积极的布局智能音响,大家谁也不想错过这一波的热潮。过去几年亚马逊卖掉了大概两三千万的音响,在国内,过去的两三年内只有几十万台的销量,但是今年阿里为了教育用户,做了一个非常大的活动,就是促销,一天就卖了一百万台,所以它一天的量就抵过了前面几年的量。
我们看一下聊天机器人行业的痛点。大家不管是和机器人音响还是什么交互的时候,我们总感觉现在的机器人还不够智能,交互的体验问题,就是和认知技术相关,特别是在意图理解,包括知识图谱、内容问答、多语言交互,我们第一步看一下在这方面的一些解决方案,从交互体验上,大家都知道,自动问答实际上也是一个比较老的课题,很多人以前用模板匹配式、检索式的方法做自动问答,我们团队比较早的用深度学习这个技术重构自动问答系统,我们从特征的表示到中文的分词、意图识别、命名识别到自动问答,我们把所有环节都用深度学习优化、重构,并且用不同的模型做,所以我们做整个环节里面,特别是意图识别领域能够达到98%以上的准确率,这在整个行业里面也算得上是比较高的水平。第二,问答的抽取,我们在一些特定领域,特别是机器人客服领域,有时候让机器人替代人工回答各种各样的业务问题,往往你要学习这些业务问题,而这些业务相关的知识很多时候被放在一些说明书里,放在一大堆资料里面,你怎么把这些很长的文档转化成机器能读懂的问答式的格式?这是非常需要技术才能实现的。我们团队之前有一些工作被认为是在国际领先的,是超越Face book、谷歌,也获得了一些国际性的专利。第三多语言交互,这也是目前世界性的难题,百度、讯飞现在都还没有外语的系统,我们在这一块也是有比较好的积累,我们目前能支持在中英日法韩俄罗斯等上十个国家的语言,我们还有别的技术相关的优势,就是我们有自主学习超级大脑,就是意图识别这一块,还有接入,我们的平台接入是通过API、SDK和芯片化的方式来进行接入,场景可以在车载家居、儿童陪伴等,我们对接了非常多的内容。第四是知识图谱,这是我们团队多年的积累,包括我们从数据上的积累,包括我们构建行业的知识图谱,能够回答针对性的行业问题,所以我们在包括五十多个高频领域,一百多个特定场景能应用,我们在音乐数据、聊天数据、知识百科的数据都积累了数以万计的数据。
最后,智能的语义交互平台,我们最近和百度、小米的审计平台、京东的阿尔法平台,我们为大平台提供交互技能,前两天我才参加完百度的大会,百度认为我们是他们很重要的合作伙伴之一,技能的提供方。我们和一些智能家居的合作厂商,和一些内容合作厂商构建智能语义交互平台,我们会对外输出,我们的很多机器人,像软银的机器人,穿山甲、小商互动等等国内比较领先的机器人公司,都在和咱们进行比较深入的合作。我们也可以在车载汽车,通过后视镜、蓝牙的方式来进行连接,此外我们和音响的厂商、耳机厂商进行合作,我们大家都希望未来能够使机器人变得更聪明,让出行变得更简单,家居变得更智能,消费电子交互体验变得更好。在这里我们大家都希望与合作伙伴一起,用我们的人工智能技术,让我们的生活变得更简单,更美好。