火热不是假象,以下的十个指数级增长趋势证明:深度学习在过去的一年内获得了极快的发展,慢慢的变成了当下的“顶梁柱”。本文从 ImageNet、NIPS和CVPR等顶级学术会议,以及谷歌、等企业应用,还有深度学习人才与投资、收购等角度分析,用13 张图解读深度学习到底有多火。
似乎一切都是从 2015年的 ImageNet 挑战赛开始的,当年在图像识别准确率上,机器首次超过了人类,被认为是一个里程碑式的突破。
2010年算法的图像识别错误率至少在25%左右,但到2015年,计算机图像识别错误率已经低于人类(人类水平大概是4%左右)。2015年是 0.03567,也就是3.5%。2016年,ImageNet 竞赛,图像识别错误率进一步下降,错误率今年的最好成绩为:平均错误率0.02991,也就是2.99%左右。
从上图能够正常的看到,在ImageNet 竞赛中,其实从2012年,开始,使用深度学习方法,错误率只有15.3 %左右。这是 Hinton 教授和他的两个研究生 Alex Krizhevsky, Illya Sutskever 的成果。据说,他们使用了 两个 Nvidia 的 GTX 580CPU(内存 3GB, 计算速度 1.6TFLOPS), 让程序接受一百二十万个图像训练, 花了接近六天时间。
2016 年,作为学界顶级盛会的 NIPS 共收到投稿超过 2500 篇,最终接收了 568 篇——保守估计接收率 22.7%。这个论文接收率并不算那么低(相较其他顶会)。
再看参会人数及其近年来的增长趋势(上图右),2016参会人数已超越了5000人——尤其是近两年,用“直线上升”形容毫不夸张。
CVPR 是计算机视觉领域的国际顶级会议。下面是 CVPR 的增长趋势图:
新智元在此前的报道曾统计过,本届会议共收到论文 2145 篇,创下历史记录(有效 1865 篇)。会议接收论文 643 篇(接收率 29.9%)。
2016 CVPR 会议接收的论文里,发表的论文中有 80% 到 90%,口头报告更是接近 100% 都来自深度学习领域。
以上能显示深度学习理论的增长趋势。但只有理论吗?让我们一起看看 Google 内部对深度学习技术的使用情况。
从上图能够正常的看到,2014年到2015年间,谷歌内部对深度学习技术的使用呈直线上涨的趋势。应用领域包括:APP、地图、照片、邮箱、语音、安卓、Youtube、翻译、机器人研究、图像理解、自然语言理解、毒品探测。
谷歌大脑负责人Jeff Dean 在接受《福布斯》的采访时曾提到,2011年到2012年间,公司使用深度神经网络技术的团队只有十几组,现在已超越200多组,有上千人在训练这类的模型,使用的就是谷歌大脑团队搭建的软件。
他说:“5年前,当我们第一次开始组建机器学习研究组,调查使用大量的计算和深度卷积网络处理问题的情况,当时公司里还没多少人在使用这种方法。后来,我们得知少数看起来可以有效应用的几个地方,这中间还包括语音识别系统,所以我们跟语音识别团队的同事紧密合作,把深度神经网络加入到语音识别系统中去,从而在识别精准度上获得了显著的提升。然后,我们又与几个计算机视觉相关的团队合作,比如图像识别和一些街景团队,这中间还包括,用图像中的原始像素去训练模型做一些有意思的事情,从图像中提取文本或者理解图像(是美洲豹,垃圾车或是别的啥东西)。
有趣的是,跟着时间的过去,更多的团队开始采用这一些方法,因为他们会听到别的团队说在尝试一些别的东西,并且获得了好的结果。不然就是,我们大家可以把他们与这些团队联系起来,或者我们大家可以提供一些在他们特定的问题语境下怎么样去使用这些方法的建议。后来,我们把这些都正规化,所以现在我们就有了一个团队来做这些扩展工作。首先是联系想要在产品中用到这些机器学习模型的团队,他们会描述自己遇到的难题,正常的情况下,我们团队会说:“这似乎跟其他团队所遇到的难题很像,我们的解决方案很有用,试试看我们的方案,然后给我们反馈”。
从2015年开始,市场对深度学习人才的需求直线年下半年开始更是以超大幅度上涨。另外,2015年开始,我们也看到了大量的学术界顶尖人才流向产业界。
2016年二季度期间,融资交易量最多的地区是美国,共发生47起交易,融资额合计5.245亿美金。
除美国以外,全球有15个国家和地区在2016年二季度发生了AI相关领域创业公司的股权投融资活动,包括中国(及香港)、印度、瑞典、乌克兰、法国和加拿大等。
其中加拿大、英国、以色列、德国的AI领域投资相对较为活跃,尤其有必要注意一下的几笔交易是:在加拿大,GE Ventures两次参与了BitStew Systems的C轮融资,该勇于探索商业模式的公司主要做(IIoT)的数据分析平台;在英国伦敦,Lerer Hippeau Ventures,Bloomberg Beta和Salesforce Ventures参与了DigitalGenius的种子轮融资,该创业企业主要为客服领域提供AI解决方案;在以色列,阿里巴巴集团投资了电商搜索发现勇于探索商业模式的公司Twiggle的A轮融资,而包括Khosla Ventures和Marc Benioff在内的投资机构则支持了医疗勇于探索商业模式的公司Zebra Medical Vision的B轮融资;在德国,New Enterprise Associates参与了Konux的A轮融资,该勇于探索商业模式的公司面向产业界提供基于AI技术的传感器解决方案。
2016年,每一个季度,都有至少10起关于人工智能的并购发生。这一指数级的增长趋势从2014年开始,目前没有一点下降的趋势。
2016年内在AI领域发生了一些非常高调的收购案,包括6月份公开的推特(Twitter)花费1.5亿美金收购MagicPony Technology,后者是一家专注视觉处理(visual processing)相关的机器学习(machine learning)算法技术公司。英特尔于今年8月以超过4以美元的金额收购 Nervana 等等。
其中,2016也成为英特尔向AI和深度学习发力的转型之年,英特尔副总裁 Jason Waxman 在接受 Recode 采访时表示,向人工智能转型可能会有损英特尔向云计算进军的努力。但 Waxman 也强调了机器学习的重要性,他表示在英特尔从一个用户控制大量连网设备到世界向一个数十亿件设备都相互连并相互对话的世界转型之际,机器学习非常重要。
人工智能特别是深度学习的发展,极大地推动了英伟达的股价的上涨。从2015年开始,英伟达的股价一直都高于纳斯达克平均水平。
最新资料显示, 英伟达了2016年第三财季财报报告当季公司营收实现大幅度增长,远超市场预期。财报公布后,英伟达股价大涨近30%至87.97美元,创历史上最新的记录。英伟达股价自2015年9月以来持续走高,涨幅已超过三倍多。
今年8月,CEO黄仁勋在投资人会议上强调,深度学习是英伟达十分重要的增长动力,也是公司一直持续大力投资的领域,“过去5年来,我们从始至终默默投资深度学习,因为我们始终相信深度学习未来对整个软件产业、整个计算机产业都有着深远的影响,我们把一切都赌在了深度学习上”。
黄仁勋还指出,英伟达数据中心业务,大约有一半都是深度学习系统,这也是得益于公司在深度学习芯片方面的大力投入。
上图是在“Google Trend” 中分别查询AI和深度学习在过去5年的搜索趋势,蓝色是“深度学习”,红色是“人工智能”。“深度学习”在总量上要少于“人工智能”,但是增长趋势很明显,最近更是越来越接近。并且,从增长的趋势来看,深度学习增长非常明显。
人工智能的“智力”水准不断增长,未来或许会超越人类,甚至是高智商的人类水平,但是,目前看来,人工智能的智力水平程度也还只比蚂蚁好一些。(图来自Wait Buy Why)。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。举报投诉
能过多大电流?这样的一个问题想必每位硬件工程师都查过。而与之相关的还有一个问题,那就是0Ω电阻的阻值
多大? 这两个问题本来是很简单的,答案应该也是很明确的,但网上网友却给出了不尽相同
国内三大运营商的4G建设正在火热的进行中,前几天报道5G的先期技术规划慢慢的开始,华为等公司已开始投入开发工作。作为一种典型的延续性技术,5G的到来看来是不可避免的,但是其
64-Kbit FRAM是什么?为何需要开发一种64-Kbit FRAM?64-Kbit FRAM
ewb 9.0中文版下载吗?谁有发我一份,谢谢!{:soso_e181:}
这篇不是写技术细节的,而是在之前学过的排序算法以及部分其它的数据结构与算法之后,个人的一些感觉,最重要的包含两个方面:怎么去
难度是一样。不同之处在于FPGA的逻辑资源比CPLD的逻辑资源多得多,FPGA能轻松实现很复杂的逻辑设计和信号处理算法,CPLD通常用于 简单的逻辑设计。 所以建议
什么好处嘛?1)方便。大多数表现在后期的开发,即在操作系统上直接开发应用程序。不像单片机
什么好处嘛? 1)方便。大多数表现在后期的开发,即在操作系统上直接开发应用程序
18 个 ADC 通道”。然而,数据表和引脚图表明只有 16 个可用,GPIO9 保留用于 WIFI 使用。ESP32-Wroom 上
KEIL、uVision、MDK、KEIL C51、RealView它们
KEIL、uVision、MDK、KEIL C51、RealView它们
嵌入式Linux的开发和研究是Linux领域研究的一个热点,目前已开发成功的嵌入式系统
什么优势,使之取得如此辉煌的成绩呢?本文分为两大部分:Linux的优点
很多Nanopi的试用体验了,那为什么时隔2年之久的我会再次使用Nanopi分享
按照实际来讲,PIC也不过是一种MCU的描述,就想C和JAVA对于编程语言一样,我们不难发现PIC也不过是通过他的功能,特性及使用场合来接触,然后通过你自己的需要去了解内部结构,总体框架。这里我引用一段大佬对于pic的描述 1PIC
多快?在loop里只写digitalWrite(LED_BUILTIN, HIGH); digitalWrite(LED_BUILTIN, LOW
python在硬件中的应用,但是讲的非常泛泛。今天我就以我的实际经验来讲一下python在我的日常工作中
是怎么做的。最后还会简单讲一下作为一个硬件工程师要怎么去学python。这里借用一下...
是学驱动还是学应用? 我只能说凭兴趣,并且驱动和应用并不是截然分开的 1. 我们说的驱动
本帖最后由 科电ETS 于 2021-6-30 12:17 编辑 电磁场
隔离门驱动器在许多系统中的电力传输扮演着重要角色。对此,世强代理的高性能模拟与混合信号IC厂商Silicon Labs推出可支持高达5KV隔离额定电压值的ISO driver隔离驱动IC Si823x。有谁知道这款业界最佳单芯片隔离驱动器解决方案
必要了解神经网络。神经网络是一种模拟人脑的神经元和神经网络的计算模型。作为具体示例,让我们考虑一个输入图像并识别图像中对象类别的示例。这个例子对应机器
从最近很多新闻上能够正常的看到,3D打印与医疗和生物行业的结合越来越紧密。医疗行业也在不断加紧引入全新的3D打印技术来辅助完成各种手术和一些高难度医学工作。最近,华森科技研发了一款专业适用于医疗行业的3D打印机,谁知道这款医疗3D打印机
?东北大学教务处党支部创新基层党建,探索“VR+党建”新模式党员戴上VR头盔,置身在党史
在异常处理向量表的设置中,为啥不直接将异常向量的入口地址写入 PC 中呢,为什么非要用什么 DCD 这些伪指令,
什么函数以及这些函数的用法(不需要源代码,只想知道每一个函数的具体用途),不知道论坛里的大神有没有相关的资源,可否发一份给我。我的邮箱是
;quot;智慧,使冰冷的机器家电等更加懂得现代人的生活需求。
足够的资源但距离太远也没有很好的方法解决急切的事情,但是,LivingLab智能家居却早就
多大呀?理论上说。data数据并没有超过250bytes,但是运行确有问题。
汽车仪表盘上有一双“眼睛”默默地感知周围的光线,从而自动调节背光亮度,以保证用户最佳的驾驶体验且降低功耗。那么,汽车仪表盘那双“眼睛”——环境光传感器,
什么技巧?使用代码优化时一定要考虑哪一些问题?C28x的编译器支持哪些“关键字”?编译器的“关键字”
几个协处理器,手册上只看到了CP14,CP15,为啥说是若干个,是否能扩展,是不是每个协处理器只有一种功能?
关联表是只保存了直接挂接在协调器下的设备,这样通过搜寻地址表来删除节点会有问题,找了下没找到这个地址表
CAN-bus总线是应用最广泛的现场总线之一,而很多非常熟练的CAN工程师,面对一条CAN报文
多少位的问题时,却不能非常准确地回答。今天我们就从最基本的帧格式来解惑一条CAN报文的
多热,这里我就不再强调了,也因此有很多人关心这样的几个问题,“适不适合转行