自动语音识别技术(Automatic Speech Recognition)是一种将人的语音转换为文本的技术。由于语音信号的多样性和复杂性,语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别的总体过程是:语音输入,然后前处理得到数字信号,再进行声学特征的提取,进行模式匹配,处理后得到结果。技术流程是:先对静音切除,再进行声学特征提取,然后对其进行分帧,得到多维向量表达的若干帧,再把帧识别为状态(难点),每三个状态合组合为1个音素,再把因素组合为单词自动语音识别错误率目前已达到商用门槛。国际上公认衡量自动语音水平的参数为语音识别错误率(WER),人类的语音识别错误率为4%,目前商用语音系统的WER在15%左右。 根据年报的披露,世界第一大语音公司Nuance的全球市占率已达60%,其WER在10%左右。Google依靠强大的深度学习,在2015年率先将WER降低至8%。国内企业方面,科大讯飞也达到了15%的使用门槛,针对会议演讲等场景达到5%以上的识别错误率,特别在针对中文部分方言也达到了实用门槛。 美国语音市场已完成布局,语义市场跑马圈地接近尾声。全球最大的语音语义的巨头集中在美国。从语音市场到语义市场,美国长期资金市场经历了相似的路径,大企业纷纷收购创业型公司,从2013年到现在,语义市场仍然在进行大规模军备竞赛,而语音市场已结束了此阶段,诞生了类似于Nuance这样的国际巨头。 1、根据中国语音产业联盟,2015年全球智能语音产业规模已达到61.5亿美元,我国产业规模为40.3亿元。 2、根据公开信息,国内语音市场之间的竞争激烈。科大讯飞和捷通华声成立早,在语音市场占据第一梯队,其中科大讯飞科大讯飞目前占有中文语音技术市场60%以上市场占有率,语音合成商品市场份额达到70%以上,在电信、金融等主流行业的份额达80%以上,开发伙伴超过1500家,是国内语音市场行业龙头;思必驰和云之声虽然成立时间较短,但是发展迅猛;2015年歌尔声学和谷歌入资出门问问,主打移动领域。此外在BAT等巨头内部也有专门的语音部门,主要服务于公司整体战略规划。总体来看,国内公司既有巨头的语音部门,又有初创公司竞争,各家技术的准确率都很高,从语音转换成文字基本都在95%以上的准确率,体验上来说差距都不大。
摘要:语音交互是基于语音输入的新一代交互模式,人通过同机器说话就可以得到机器的反馈结果,代表性的语音交互产品有智能音箱、虚拟助手等。实现语音交互所需的技术有语音识别(ASR)、自然语言理解(NLU)、对话管理(DM)、自然语言生成(NLG)、语音合成(TTS)等,其中 ASR语音识别是语音交 互的起点,也是核心,其效果的优劣决定了后续语音处理过程的质量。ASR语音识别技术赋予机器感知能力,将语音信号转变为相应的文本或命令供机器处理,一个完整的语音识别大致分为两个步骤:首先是在语音输入之后的语音特征提取,其目的是从语音波形中提取出随时间变化的语音特征序列;随后是声学模型与模式的匹配过程,过程中将输入语音的特征矢量依次与训练阶段模板库中的每个模板进行相似度比较,输出相似度最高者作为识别结果。
摘要:具体到核心产业的各个层级,全球市场规模中基础层智能芯片占比仍然最高,约为33.6亿美元,表明智能芯片仍然是未来全球人工智能产业的重要发展方向之一,此外算法模型和智能传感器体量相当,分别为13.4亿美元和20.2亿美元;技术层方面,得益于智能语音助理和人机语音交互技术的大幅度进步,语音识别市场迎来全面爆发期,达到71.8亿美元,占据技术层整体规模的三分之二以上,图像视频识别次之为25亿美元,文本识别相对市场规模较小仅为7.3亿美元;应用层市场规模分布较为平均,智能教育和智能安防市场规模分别为26.3亿美元与26.5亿美元,均为16%左右,其它产业发展规模继续保持稳步增长。
摘要:最新数据表明,小度目前出货量处于国内第一、全球第三。虽然智能音箱整体的量级不算大,但处在快速发展 阶段,根据Research and Markets研究预测,全球智能语音市场将持续快速增长,到2020年市场规模将达到 191.7亿美元。
摘要:带有Alexa语音助理的设备超过了1亿台,Alexa的技能翻倍至8万个,和2017年相比,客户与Alexa的对话也增加了数十亿次。在亚马逊的带动下,全球智能语音设备已经进入高速发展期,根据国际咨询调查机构StrategyAnalytics发布的数据,2018年全球智能音箱的总出货量达到8620万台,较2017年的3200万部增长了5420万台,增幅超过170%,其中第四季度出货量3850万台,仅这一个季度的出货量就超过2017年全年出货量。
摘要:根据CB Insights行业分析师的共识,语音识别领域的市场规模,预计将达到490亿美元。
摘要:全球智能语音行业在大数据、移动互联网、云计算等技术的发展推动下,已进入快速应用阶段,预计到2017年,全球智能语音产业规模将达到95.6亿美元,年复合增长率31.1%;其中中国智能语音产业规模将达到101.4亿元,年复合增长率达63.6%,占全球智能语音产业规模的比重将由2012年的。
摘要:7月30日,美国市场研究机构StrategyAnalytics发布报告称,2023年全球将有90%的智能手机拥有智能语音助手,在2018年,中国公司百度已占有17%的市场占有率,仅次于谷歌和苹果。报告显示,到2018年底,GoogleAssistant的市场份额有望增至51%,苹果Siri排名第二,市场份额将降至31%,百度DuerOS占17%,由2017年的第四名上升至第三名。
摘要:另外,人工智能,一种无处不在的科技潮流,有像亚马逊Echo这样的智能音箱,Alexa的语音识别服务正在腾飞;2017年,智能音箱的销量增长了约279%,达到2720万台,2018年这一数字可能达到4360万台。
摘要:智能语音可以跟电视、音响、空调、窗帘、灯具、玩具等各种家用设备和智能家居控制中枢系统相结合,通过语音交互实现一个入口控制全部功能。从我国的市场规模来看,智能语音市场近几年发展迅速,从2011年的不到6.4亿规模发展到2016年 59.3亿,2011年到2016年 CAGR为 57%,预计2017年起将步入高速发展阶段,市场规模预计突破100亿元,同比增速达70%。
标题:2018中国埃森哲消费者洞察系列报告:互联世界,智能生活,正在发生的未来
摘要:智能语音市场的规模也呈倍数递增,2016年中国语音服务市场达到59亿人民币,比2011年增长了近10倍。科大讯飞在中国智能语音产业的市场份额达到770%。
标题:山西证券计算机行业2017年中期策略:掘金细分行业龙头,关注估值消化触底反弹机会
摘要:语音识别下游应用非常广泛,市场规模呈高速增长态势。中国产业信息网预测,2017年中国语音识别市场规模将突破100亿元,同比增长69.8%。
摘要:2018、2019年,科大讯飞在智能语音及人工智能领域获得20项世界冠军,
摘要:然而,据前瞻产业研究院数据,尽管指纹识别市场份额占比较高,但整体呈下降趋势,从2007年的66.9%降 至2013年的60.1%,预计到2020年将下降至52%左右;而语音识别、人脸识别、虹膜识别所占份额则不断增 长,到2020年比重预计分别达到22.4%、9.6%、6.4%。这是否可以说指纹识别已逐渐过时?
摘要:如根据KPCB发布的《2018互联网趋势报告》,谷歌机器学习技术词语识别准确率达95%,超过了人类识词准确率门槛(约94%);国内厂商科大讯飞更是在2018年率先在行 业内做到通用语音识别率达98%,基本可以满足用户的高频需求。语音识别准确性的提升使得语音交互的商业 化落地成为可能,如近几年智能音箱产品真正落地成为现实,智能音箱所带来的用户数据也将成为未来AI领域行业专题研究报告的核心资源
摘要:预计全球智能语音产业规模将从2011年的19.7美元增加到2017年的105亿美元,CAGR达32.17%;其中中国智能语音产业规模将从2011年的6.3亿元增加到2017年的83.2 亿元,CAGR达53.74%,占全球智能语音产业规模的比重也逐年上升。
摘要:企业SaaS机构数据:百度DuerOS 手机智能语音助手市场份额全球第三美国市场研究机构Strategy Analytics发布报告称,2023年全球将有90%的智能手机拥有智能语音助手,在2018年,中国公司百度已占有17%的市场份额,仅次于谷歌和苹果。报告显示,到2018年底,Google Assistant的市场 份额有望增至51%,苹果Siri 排名第二,市场份额将降至31%,百度DuerOS占 17%,由2017年的第四名上升至第三名。
摘要:目前,指纹识别因其发展历史悠久、技术最为成熟以及应用最为广泛等优势,占据生物识别的半壁江山,市场占比约58%,而语音识别、人脸识别、虹膜识别位居其次,市场份额分别为22%、7%和6%,随着其他生物识别细分市场的快速发展,预计到2020年,指纹识别的市场规模将达到130亿美元。尽管指纹识别预计市场占比仍有52%,但是市场规模增幅只有73%,远小于人脸识别的167%,其他的140%,语音和虹膜识别的100%。
摘要:一方面星星之火可以燎原,目前在电话预约这一细分领域的AI突破或很快延伸到其他需要人际交流的行业,另一方面谷歌Duplex背后的语音识别、NLP、声音合成等关键技术,国内以科大讯飞为代表的人工智能企业实际均处于世界顶尖水平,相信公司宣告下周即将发布的讯飞AIUI3.0有望实现类似重大进展。
标题:视听器材行业深度研究:现象思考:100亿的创维酷开‚百度在想什么?
摘要:我们认为,此次《行动计划》的推出将加快人工智能从国家战略向产业化落地的快速推进,部分重点领域如智能网联汽车、智能机器人、语音识别和图像识别等领域有望在国家政策、资金和市场的三重推动下逐步率先迈入大规模应用阶段,相关领域投资机会正逐步显现,对此我们重点推荐关注:科大讯飞(语音识别全球领先、教育、医疗、汽车等领域AI应用深度布局)、海康威视(视频监控龙头、安防人工智能领军者)、四维图新(受益车联网及汽车AI市场带动,业务需求有望加速释放)、东软集团(深度布局医学影像产业链)、思创医惠(携手Watson实现AI在医疗领域的应用)、中科创达(智能操作系统龙头企业)、中科曙光(联手AMD开发X86架构芯片、与寒武纪深度合作)、启明星辰(网络安全龙头企业,党政军领域客户优势明显)。
标题:计算机行业3月动态报告:行业景气度稳健上升,看好具备核心技术企业发展前景
摘要:清华大学中国科技政策研究中心,中国银河证券研究院应用领域典型:语音识别市场潜力继续上升,预计2020年将接近300亿。
标题:《人工智能发展白皮书-产业应用篇(2018年)》发布:八大应用领域完全拆解
摘要:自然语言处理主要涉及语音识别、语音合成、语义理解、机器翻译,自然语言类产品呈现实用化的发展趋势,但是产品成熟度上仍存在较大的提升空间。
标题:2018年计算机行业年度策略:“AI+”走向产业化,看好细分子行业第一梯队
摘要:研究报告显示,全球智能语音市场将持续显著增长,预计到2020年,全球语音市场规模将达 191.7亿美元。计算机视觉应用场景分为图像识别和人脸识别两大类,其中动态人脸识别技术是目前创业热度最高的细分领域,尤其是金融和安防场景。
标题:计算机行业周报:AI产业发展三年行动计划出台‚京拟建国家网络安全产业园
摘要:工信部印发AI产业发展三年行动计划:12月14日,工信部印发了《促进新一代人工智能产业高质量发展三年行动计划(2018-2020年)》。提出的目标为,到2020年,力争实现人工智能重点产品规模化发展,整体核心基础能力显著增强,智能制造深化发展,产业支撑体系基本建立,着重在智能网联汽车、智能服务机器人、智能无人机、智能语音交互系统、智能家居产品、医疗影像辅助诊断系统、视频图像身份识别系统、智能翻译系统八个领域率先取得突破。
标题:平安证券计算机行业动态跟踪报告:从Google秋季发布会看科技行业的发展趋势
摘要:根据《中国智能语音产业収展白皮书》的预测,2017年国内智能语音市场觃模将超过100亿元,增速高达近70%,呈现出显著的爆収趋势。
摘要:据ResearchandMarkets研究报告显示,全球智能语音市场将持续显著增长,预计到2020年,全球语音市场规模将达191.7亿美元。
摘要:智能语音技术作为一种更为自然的人机交互方式,其下游应用广泛,包括智能车载市场、智能家居、智能可穿戴设备、智能个人助理等。随着各下游市场智能化渗透率的逐渐提升,以及智能语音技术渗透率的提升,语音市场行业规模有望保持迅速增加势头。易观智库认为,随着语音识别性能的提升和市场教育的完成,基于语音交互的垂直场景应用将日趋成熟,未来1-3年将迎来产业快速地发展期。
标题:平安证券2017年计算机行业年度策略报告:坚守价值与政策主题,静待技术创新开花
摘要:我们观察到,技术趋于成熟与基于人机交云的潜在应用场景扩张正在共同驱动语音识别与计算机视觉市场增 长。由于当前语音识别准确率已相当高,语音指令更加容易识别,受接收设备和物理空间限制较小,因此语 音识别技术或将在2017年迎来应用的爆収点。根据《中国智能产业収展白皮书》预测,2016与 2017年语 音识别技术市场的同比增速将分别达到约47%和70%。对于计算机视觉,我们预计正确率已超过人眼的人脸 识别技术仍将是应用层面的主要兲注点,兵市场增速应在较高水平保持平稳。根据《中国人脸识别行业研究 及収展趋势预测》,未来五年人脸识别市场觃模增速将保持在20-30%区间,增速在此水平上呈现微幅下降走 势
摘要:氧化锆契合指纹识别、无线、替代蓝宝石玻璃,用于指纹识别盖板指纹识别隶属于生物识别技术中的一种,生物识别是通过一系列的技术方案实现人体身份的识别和认证,目前主要的生物识别技术包含五种,分别为:指纹识别、面部识别、虹膜识别、语音识别和签名识别。以上这些生物识别技术中,指纹识别以其独有的优点,成为市场上生物识别技术中最成熟、应用范围也最广泛的技术。
摘要:智能语音产业处于规模化增长的导入期语音技术从2000年开始逐步达到实用水平,应用领域不断拓展,目前 已经大规模应用于电信、金融、政府、GPS导航、学习机、MP3/MP4/PMP播放机、彩铃/炫铃等领域。作为新兴 的行业,目前国内语音市场已经处于规模化增长的导入期,科大讯飞的电信级语音平台、嵌入式语音软件和行 业语音应用软件已经出现规模化增长,根据赛迪顾问预测,2007年-2010年中文嵌入式语音合成技术市场将 继续保持着50%以上的年复合增长率。
标题:2015世界机器人大会系列纪要之三:人工智能推动服务机器人产业应用
摘要:机器人向智能机器人的演变,需要实现从计算智能、感知智能向认知智能的转变,即拥有运动、感觉及思考功能於一体。目前,机器人处於感知智能阶段,深度学习算法及并行计算水平的提高带来人工智能在视觉识别、语音识别以及自然语言识别的进步,2015年机器视觉识别率超过人眼。目前国内服务机器人智能化有限,同质化严重,主要集中在扫地、送餐、老人及儿童陪护,家用机器人市场,随着家电产商的进入,市场竞争已经日趋激烈。服务机器人要获得大规模应用,需要具备吸引力、简单易用、且令人产生依赖的特性,核心任务是为人类解决问题。机器人的发展应立足於实际场景中的应用,在充分发掘已有研究成果的同时,寻求单点技术突破及创新,做核心技术优化。而在发展早期,实用性、功能性的作用大於外观。催化剂:1)芯片以及云计算提供计算能力2)大数据、各种人机交互、协作发生产生的线)在算法的支撑下不断迭代、挖掘知识,以推动人工智能及机器人更大规模的产业化应用。
摘要:(3)《郑州市中级人民法院关于印发〈郑州市中级人民法院关于加快?智慧法院?建设与应用的指导意见〉的通知》要求?为降低建设成本,方便系统运行维护,全市法院信息化建设将以‘系统应用环境及支撑硬件环境中院集中部署,基层法院购买授权及客户端’的思路进行,各基层院不得重复建设。?(4)科大讯飞与郑州市中级人民法院签订有战略合作协议,联手开展人民法院领域智能语音及人工智能技术的研究与应用,加快?智慧法院?建设,助力信息化3.0版的实现。
摘要:2016年,中央、国务院印发《国家创新驱动发展战略纲要》强调,坚持走中国特色 自主创新道路,把创新驱动发展作为国家的优先战略,要求以科技创新为核心带动全面创新,推动经济社会 发展动力根本转换。发展四新经济是我国创新驱动战略的重要组成部分,同时,四新经济也是供给侧结构改 革的主要着力点,能够真正提高全要素生产率。以大众创业、万众创新为抓手,依托“互联网+”,能够促进 新技术、新产业、新模式、新业态蓬勃兴起,而四新经济也能够充分发挥科技创新在推动产业升级中的作 用,有力支撑“中国制造2025” 战略,增添经济发展新动能。四新经济发展前景广阔,目前我国已经在北斗 卫星导航、电动汽车,语音识别等新技术领域取得了突破性进展,“互联网+”示范型、产业链贯通型等新 模式也有了一定的发展。长期来看,四新经济的发展能够促进高新技术与传统产业的深度融合,提升产品的 技术水平,整合优化行业资源,节省交易成本,推动传统行业的优化升级,将经济增长由主要依靠投资拉动 转向依靠创新推动,促进我国经济发展由量到质的提升。
标题:美亚柏科深度报告:电子数据取证有望稳增,大数据与网络空间安全有望打开空间
摘要:2017年6月,最高人民检察院印发《检察大数据行动指南(2017-2020年)》,全国检察机关将依托大数据及智能语音等前沿科技,统筹利用以司法办案数据为核心的检察数据资源,建立检察大数据总体架构。2017年6月,公安部召开的全国公安科技信息化工作会议,强调各级公安机关要以大数据建设和应用为重点,紧密结合“四项建设” 任务,把大数据理念贯穿于基础信息化建设全过程、各环节。
摘要:2017年7月,国务院印发《新一代人工智能发展规划的通知》,人工智能发展成为国家战略规划,而智能语音技术是人工智能产业链上的关键一环,将成人工智能应用发展的重点方向、推动人工智能落地实现。
摘要:政策扶持,底层+应用层同时发力,人工智能硕果遍地:国务院印发《新一代人工智能发展规划》,政策扶持行业进入快车道;语音识别、图像识别等技术在车载、教育、安防、医疗等领域已经落地,自动驾驶突破不断,AI+应用持续落地;AI硬件业绩落地,国内企业也有较强的研发实力,有望弯道超车。
摘要:10月13日,国家发展改革委办公厅关于组织实施2018年“互联网+”、人工智能创新发展和数字经济试点重大工程的通知,我们大家都认为试点将推动核心技术环节加速落地,把握科技领军企业的投资机遇,AI推荐科大讯飞、四维图新、苏州科达、同花顺、思创医惠等,关注中科曙光、浪潮信息;云计算重点推荐用友网络、广联达、金蝶国际、汉得信息、东方国信等通知具体解读如下:1)试点重大工程开始落地,资金扶持将推动产业加速发展;2)对申报项目要求严格,有望推动基础核心技术突破;3)互联网+重大工程聚焦云计算、物联网和智能制造三大领域,意在突破操作系统、支撑平台、高端传感器等基础核心环节;4)人工智能聚焦智能芯片和开源平台等核心技术,人脸语音识别产业化应用、无人驾驶、智能机器人等;5)数字经济聚焦政务信息共享、大数据应用创新和基础设施等。
摘要:根据《中国智能产业发展白皮书》预测,2016与 2017年语音识别技术市场的同比增速将分别达到约47% 和70%。对于计算机视觉,我们预计正确率已超过人眼的人脸识别技术仍将是应用层面的主要关注点,市场增 速将在较高水平保持平稳。根据《中国人脸识别行业研究及发展的新趋势预测》,未来五年人脸识别市场规模将 保持 20-30%区间的高速增长水平。
标题:传媒互联网行业评论周报:国家成立千亿互联网投资基金,中国网民总量超7亿
摘要:(资料来源:Donews)2017年 1月 23日 传媒互联网行业评论周报97.教育部印发语言文字“十三 五”发展规划,支持研发语音识别、合成与评测技术(2017.1.16)1月 16日,教育部官网发布《 国 家语言文字事业 “十三五 ”发展规划 分工方案》文件。规划提出将语言文字要求纳入学 校、教师、学生管理和教育教学的各个环节。同时推进语言文字信息化建设,支持推动自然 语言 处理、语音 识别 与合 成、文字识别等智能化理论研究和技术研发 ;建设全球中文学 习网络平等。
摘要:1.政策先行,产业高质量发展迅速2017年9月,全国第一个地方性人工智能促进政策在中关村科技园区管理委员会发布《中关村国家自主创新示范区AI产业培育行动计划(2017-2020年)》结合中关村人工智能产业高质量发展的特点和产业基础,将AI产业概括为人工智能芯片及传感器,操作系统和基础软件,计算机视觉、语音识别、自然语言处理、生物特征识别、新型人机交互、自主决策控制等核心算法,细分行业应用及系统集成等领域。