热潮,入局并不算晚,但目前的融资大多还停留在A轮或者B轮,而同时期的语音、
2019年初,全球创投研究机构CBInsights发布了32家全球AI独角兽公司名单,其中美国有17家,中国有10家,商汤科技、云从、云知声、寒武纪等纷纷上榜。
经过政策、资本的快速助推,计算机视觉领域、语音领域纷纷跑出多个独角兽,而作为“皇冠上的明珠”的NLP领域却难见独角兽的影子。
众多的NLP领域公司大多成立在2015年、2016年左右,正逢AI热潮,入局并不算晚,但目前的融资大多还停留在A轮或者B轮,而语音、计算机视觉公司们已经在纷纷冲刺上市。
8月5日AI语音公司云知声对CV智识证实,正在接受科创板上市辅导;8月25日晚,计算机视觉公司旷视科技向港交所递交IPO招股书。
AI主要包含两个层面,一个是认知智能,一个是感知智能。比如语音识别、计算机视觉属于感知智能的层面,而 NLP 则属于认知智能层面。
为何NLP公司们跑的最慢?当前的落地应用到底发展到了什么程度?CV智识带着这样的疑惑与业内人士聊了聊目前的现状。
“NLP缺少相对独立且足够大的场景”,深度好奇创始人吕正东告诉CV智识,“它往往会变成一个引擎或者一个特定功能上的服务,这个的确制约了它的市场。”
据中商产业研究院发布的《2018-2023年中国安防行业未来市场发展的潜力及投资机会研究报告》数据统计显示,我国安防行业市场规模从2012年的3240亿元增长到2017年的5960亿元,年均复合增长率达13%左右。
千亿需求驱动商业发展,技术突破加上场景自然结合,独角兽自然就容易脱颖而出。
反观NLP,众所周知,特别纯粹的应用就是机器翻译,众多行业公司产品也扎堆而生。
2016年底,科大讯飞推出晓译翻译机,直到2019年5月,讯飞翻译机更新至3.0;搜狗的旅行翻译宝在2018年1月正式亮相,9月又推出了搜狗翻译宝Pro;猎豹移动在2018年7月发布了小豹AI翻译棒。
出境旅游的语言沟通的确是很多游客的最大瓶颈,游客对智能翻译机的需求也的确存在,“只是用户的身上已经存在了智能手机、智能手表等不同的智能硬件,对于用户来说,真的愿意仅仅为满足单一的翻译需求再增加一个硬件吗?”一位NLP领域产品经理对CV智识表示。
为了一个简单的需求,用户要付出的价格并不便宜:小豹AI翻译棒售价229元,搜狗翻译宝Pro售价2299元,讯飞翻译机3.0售价3499元。
从互联网时代的百度在线翻译、谷歌翻译等产品来看,日常翻译慢慢的变成了了一个带有天然的平台性或者免费服务性质的业务。
且根据中商产业研究院发布的《2018-2023年中国翻译机行业未来市场发展的潜力研究报告》预计我国翻译机市场规模将从2016年的396亿增长到2020年的561亿元,远没有安防和身份验证市场那么大。
除了市场本身有待验证之外,有业内人士对CV智识表示,“翻译机是一个强技术驱动的产品,并不是语音和翻译的简单串联,语言具有复杂多意性的特征,很难实现标准化和一致性。”
去年4月10日,腾讯翻译君在实时翻译过程中,不仅没有翻译成很通顺的中文,而且出现了几乎占满了几乎一整页的“for”。
腾讯翻译君在之后承认,包括神经网络机器翻译在内的,目前在原理上还有一定不确定性,在特定的情况下有一定的概率引发翻译偏差。
“语音翻译中的语音本身也有自己的技术,它并不是为了后面的翻译专门准备的,因此它在很多时候有自己的优化目标,但这个优化目标有可能是在某些方面和翻译不一致,因此在两者结合过程中也需要技术上的再次突破。”
“想打造好的NLP技术非常难。NLP不是一个单一的学科,里面其实会牵扯到深度学习,认知领域,情感模型等等。而且语言的场景太复杂了,就拿中文来说,同一句话放在不同的场景里会有完全不同的解读。”竹间智能创始人兼CEO简仁贤也对CV智识坦言。
“近年来NLP、语音、视觉有融合发展的趋势”,有业内人士对CV智识表示。
除了纯粹的机器翻译场景之外,NLP与其他AI技术融合落地的智能助手以及智能客服成为了重要的落地场景。
2014年亚马逊Echo首次登场,2016、2017年苹果Homepod、谷歌Home、微软Invoke陆续“进场”,智能助手成为各家智能音箱的最大卖点。
随后国内传统硬件厂商和互联网厂商更是争相入局“圈地”,包括小米、阿里巴巴、联想、京东等,相继推出自己的智能音箱。
奥维云网(AVC)全渠道推总多个方面数据显示,2019年上半年,中国智能音箱市场在售机型数达到86个,销量为1556万台。除了智能音箱之外,智能助手也成为智能手机的标配。
小爱同学智能语音助手赋予小米手机多项智能化功能;OPPO在今年最新推出的ColorOS 6上也加入了语音助手Breeno;2016 年 11 月,伴随着华为旗舰机型 Mate 9 的发布,华为智能助手正式推出;vivo也从 X21手机开始,在系统中加入智能助手Jovi。
市场研究公司Strategy Analytics报告数据显示,到今年年底共有47.7%的智能手机将会搭载AI智能语音助手,到了2023年,全球有超过90%的智能手机将会搭载全新的语音助手。
在这场如火如荼的争夺中,无论是巨头还是勇于探索商业模式的公司纷纷进入,勇于探索商业模式的公司大多选择解决方案提供商的方式与巨头合作。但不少业内的人表示,这大概率只会成为巨头的游戏。
“智能助手通常会受到它所搭载的设备和系统制约,硬件和系统商拥有比勇于探索商业模式的公司更高更多的权限。并且很多巨头已经组建自己的技术团队,它们还拥有海量的数据及实验场景。”吕正东表示。
“智能助手整个模式和技术都已经已经比较白菜化了,手机上的这种对话其实除了语音之外,其他的东西都很难做出非常深的技术了,就是要靠数据积累起来,落地比较多的场景。”有业内的人表示。更何况,以当前NLP技术发展来看,很难让智能助手真的“智能”。
我们经常会遇到答非所问的“智障”表现,比如,你问“美国总统是谁?”智能助手会说“特朗普”,但当你问它“美国总统是特朗普吗?”它就说“不知道。”
今年7月,据《卫报》报道,苹果的一名承包商称,为提升Siri的产品能力,苹果会雇佣外部承包商审听录音,这中间还包括了Siri在意外被激活时收录的私密对话,例如医疗信息、毒品交易和其它信息。
之后苹果公司发表了一份官方声明称,只有不到1%的Siri响应会被分析以改善服务。
之前,来自谷歌雇佣的人工监听团队的爆料人向比利时荷兰语国家广播电视台(VRT)提供的1000条对线条都是在Google Assistant被意外唤醒的情况下录制的。
面对频频发生的隐私泄露事件,用户开始担忧智能设备的隐私问题。据MusicWatch的一项调查显示,约有一半(48%)的收房的人说他们担心与智能音箱相关的隐私问题。物联网的发展,信息的边界被无限扩大,但当隐私问题引起争议时,显然很多厂商并未做好准备。
人工客服为主体的阶段,大部分机构采取人海战术提供“7*24小时”的咨询服务,成本高、效率低。
互联网时代,大量搭载标准化功能模板的APP、网页端客服产品也并未解决产品体验问题。
随着深度学习等前沿算法被引入到NLP领域,智能客服逐渐开始替代人工客服。
千亿市场,资本纷纷用钱投票。根据前瞻产业研究院数据,截止2018年5月28日,国内包括智能云客服以及客服机器人在内的公司共计69家,累计融资额35.16亿元。
从类型上来看,有从PaaS云通讯延伸到SaaS客服的公司,比如环信、容联七陌;有互联网巨头旗下的智能客服业务部门,比如网易七鱼、腾讯企点;也有单纯的云客服公司,比如Udesk、快商通;也有客服机器人公司,比如云问、追一科技等。
智能客服的客户多为传统行业,业务相对复杂,在NLP技术开始从服务场景、交互方式等重构客服市场时,也不得不面对究竟是以项目制还是标准化软件产品为主的选择。
前者客户接受度高,但需要占用大量人力成本而且难以规模化复制,后者人力成本低可实现规模化复制。
一层是商业模式因素,目前传统行业的大公司基本还是希望项目制结算,这个是现状,但长期看,订阅的模式也会逐渐增加。
过去20年,IT行业的资源都投入到了互联网行业,直到最近几年,资本和人力才逐步投入到企业软件领域。
他表示,企业软件产品化能力和人才沉淀还需要一点时间,当AI产品化程度足够高的时候,项目制形式的规模化和毛利也不会是问题。追一科技现在既做深度定制,也做标准化产品输出,通过银行、保险、券商、能源、地产、汽车的头部客户合作,形成标杆效应,不间断地积累经验、数据,逐渐打磨出标准化产品。
晓多AI客服创始人江岭曾在接受小饭桌采访时表示,更偏爱SaaS模式,“做传统大企业客户本地化部署项目周期太长,成本比较高,业务增长也比较缓慢,更重要的是得不到数据反馈来形成闭环,因此我们没选择这个方向。”简仁贤也表示,“定制化虽然是需求上的变革,但在制作层面平台化肯定不可避免。”
在这样的思路下,竹间研发了Bot Factory?平台,能够让客户们能自己快速根据场景去做定制化。
与消费互联网不同的是,智能客服市场是一个长跑赛道,“如果你希望比别人跑得快的话,那首先是数据的积累,不管是死数据还是活数据的积累,模型其实很多时候是拿数据堆起来的;第二是模式要跟上,包括怎么把智能客服产品去交给客户,需要怎么去维护等。”吕正东表示。
无论是智能助手还是智能客服,在交互的过程中,总会发现除了任务问答之外,还会有闲聊功能。
“拆解机器人的技术,你会发现,当你一个问题或一句话过去,它会做一个分发,很多时候它会分发到闲聊这个模块上,启动闲聊功能。”
竹间智能高级AI研究员赵景彦曾分享过一个数据:机器人上线%在做一些正规的业务问答。有些公司就将这部分的闲聊功能拆解出来单独做成一个产品,比如微软推出的小冰。
小冰是一个基于EQ的对线年,由微软(亚洲)互联网工程院打造。8月15日,微软刚刚发布了第七代小冰。
但开放域聊天技术本身要比任务驱动的技术更复杂,“目前整体的NLP技术就像深度学习出来之前的计算机视觉技术所处的阶段”,吕正东对CV智识表示。
还有业内的人表示,“这并不是一个刚需产品,意义不大。”对于当前的NLP应用来说,缺乏相对独立且足够大的场景加上技术相对后发是硬伤,但正因为NLP领域尚待突破,寒武纪副总裁刘道福曾表示,这样的领域复制之前平台创业的方式,即从学术到商业的路线的可能性仍在。
在大模型的发展史上,Scaling Law(规模律)发挥了核心作用,它是推动模型性能持续提升的主要动力。Scaling Law揭示了这样一个现象:较小的语言模型只能解决自然语言处理(
)中的部分问题,但随着模型规模扩大——参数数量增加至数十亿甚至数百亿,曾经在
)和深度学习。具体而言,它基于Transformer架构,使用了大规模无监督学习方法,例如自回归语言建模和掩码语言建模,来训练一个庞大的神经网络模型。
的革命性突破 /
据了解,月之暗面创立于2023年3月,凭借一支高素质的核心技术团队,迅速崛起并成为该
的佼佼者。团队囊括Google Gemini、Google Bard、盘古
和悟道等大模型项目的研发精英,累计经验超过10年。截止当前,公司员工总数突破80人。
我们主要探索了3D视觉中scale up模型参数量和统一模型架构的可能性。在
,scale up大模型(GPT-4,SAM,EVA等)已经取得了很impressive
近年来,我们听说了很多关于Transformers的事情,并且在过去的几年里,它们已经在
取得了巨大成功。Transformers是一种使用注意力机制(Attention)显著改进深度学习
BERT和 GPT-3 等语言模型针对语言任务进行了预训练。微调使它们适应特定
,如营销、医疗保健、金融。在本指南中,您将了解 LLM 架构、微调过程以及如何为
大模型 /
摘要做全面的统计分析,发现不同语言背景的作者在写作中的词汇、形态、句法和连贯性方面有明显的差异,这表明
存在语言偏置的可能性。因此,我们提出了一系列建议,以帮助学术期刊和会议的出版社改进他们对论文作者的指南和资源,以增强学术研究的包容性和公平性。
的语言偏置问题分析 /
碳化硅(SiC)具有更低的阻抗和更宽的禁带宽度,使其可承受更大的电流和电压,同时实现更小尺寸的产品设计和更高的效率。
是什么方向 人工智能(AI)已经日益普及,正在改变我们的方法和方式。AI 涵盖了许多
主要研究怎么样构建计算机程序,使其能够理解、解释、生成和处理人类自然语言。自然语言处理技术能帮助计算机理解人类的语言、意图和文化。
管理扩展(RME),这是该体系结构的扩展。 RME是Arm机密计算架构(Arm CCA)的硬件组件还包括软件元素。RME动态地将资源和内存传输到一个新的受保护的地址空间,更高特权
超大预训练模型(large scale pre-trained model, LSPTM) 的发展在人工智能
的潜在应用 /
,允许从业者利用预先训练的模型来完成自己的任务,从而大幅度减少了训练时间和计算资源。在本文中,我们将讨论迁移学习的概念,探索一些流行的预训练模型,并通过实际示例演示怎么样去使用这些模型进行文本分类。我们将使用拥抱面转换器库来实现。
鸿蒙开发接口媒体:【@ohos.multimedia.image (图片处理)】
有关PL端利用AXI总线控制PS端DDR进行读写(从机wready信号一直不拉高)
全志H616(BIGTREETECH CB1)和 博通BCM2711(树莓派4B)CPU对比测试