2015年底,乌镇世界互联网大会的成功举办夺人眼球。没有引发足够关注的一条新闻是,就在互联网大会之前,在南美智利举办的第14届国际计算机视觉大会(ICCV)上,微软亚洲研究院抢得头条。ICCV作为两年一届的计算机视觉领域顶尖盛会,旨在展示本领域的最新突破。微软亚洲研究院的视觉计算组研发出全新深度学习方法,具备152层类神经网络,比原先多出132层,即用同样的百万比资料就可以训练出深层的类神经网络。这些最先进的深度学习类神经网络,能将照片中的车、房、人、物等等1000类物件精准地识别出来,平均错误率从几年前的动辄50%到如今的3%,已可接近实际应用。
计算机视觉是一门研究怎么样使机器“看”的科学,更进一步说,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像,实现超越人类视觉的高精度、高速度、高稳定性。
众所周知,AI在过去的几年里长期处在持续的高速发展阶段,很多机器人也已经具备了相当高的智能化特点。但是相较科幻大片中的智能机器人来说,现实中所取得的科研进展目前还远远不足。要想得到一台真正意义上的AI,需要一步一步地逐步进行。机器人开发的下一个方向首先应该对准哪个领域呢?很多科研人员给出了相同的答案:机器视觉领域。
如果想让机器人很好地去替代人类工作的话,首先要做到的正是让它们“看”到东西才行。以无人机和扫地机器人为例,只有它们具备观察、判断事物的能力,才能真正智能化地自行解决一些问题。
微软全球执行副总裁沈向洋在上周末举办的未来论坛上说道:“人工智能这件事是相当于人类智能,是两个方面的研究。一个方面叫作所谓的感知,另外一个方面是所谓的认知。真正要把AI做到像人类智能这么好的话,首先是要做感知这一个方面,然后才能实际做到智能方面、做到认知。这里面不仅是计算机学科,也有心理学、哲学、社会学等的问题。逐渐重要的,其实就是脑科学的问题。”
沈向洋介绍说,在过去这五十年来,科研人员对于计算机视觉方面的研究主要不外乎做三个方面的问题,逐层提高:首先是图像处理的问题,线条、色彩等;之后是这几年十分火热的图象识别的问题;而最后则是图像理解的问题。
“真正做计算机视觉的人,往前走研究人工智能,就要解决图像理解的问题。今天我们讲识别这件事已经是取得了巨大的进展,特别是最近四五年;但图像理解刚刚起步。计算机视觉虽然已经做了五十年,但是仍然有很长的路要走。”沈向洋说。
当下,中国正变成全球机器视觉发展最活跃的地区之一,应用场景范围涵盖了工业、农业、医药、军事、航天、气象、天文、公安、交通、安全、科研等国民经济的各个行业。作为全世界制造业的加工中心,中国有许多高要求的零部件加工及其相应的先进生产线,使许多具有国际领先水平的机器视觉系统和应用经验也随之进入国内。
第14届ICCV大会的赞助商名单中,也首次出现了不少中国企业身影,商汤科技、百度、Viscovery创意引擎,汉字在赞助榜上快占据半壁江山。除了在世界顶尖国际会议上越发活跃之外,中国的计算机视觉学者也借由区域型会议如ACCV,以及国内计算视觉大会CCCV、RACV,凝聚了大量的政、商、媒体、学界的焦点与资源。
在计算机视觉的诸多应用中,“视频内容关联广告”是中国独创于世界的特色市场。有经验的人指出,这块技术甚至比全球第一视频网站YouTube早跑了两年。国内视频网站竞争非常激烈,目前大多还处于烧钱阶段,如何盈利成为共同思考的第一要务。阿里和优酷、腾讯、爱奇艺、搜狐等视频大佬,都开始钻研基于视频内容识别的关联广告,即边看边购物体验。
用户在看视频时弹出的各类同款商品推送,其实已经是深浅不一的机器视觉技术。欢快地观赏综艺娱乐节目时,隐藏在屏幕背后的计算机已能“看到”你喜爱的明星和商品,在网络中挖出他的八卦,他的同款唇膏、鞋子。这就是智能化的视频内容辨识,用机器取代人眼、人脑,识别甚至肉眼无法认知的物件纹路、形状、商标,用大数据技术做到更相关的商品、知识信息匹配推送。虽然用户会感觉自己的隐私被发现,但对于各大公司来说这是一块亟待开发的金矿所在地。
国内机器视觉从上世纪80年代萌芽以来,通过艰难的概念引入,至2002年迈入发展期,特别在2012年,工业与信息化部印发了《高端装备制造业“十二五”发展规划》,规划明确将智能制造装备列入现阶段高端装备制造业发展的重点方向之一。2013~2015年间,随着“工业4.0”“中国制造2025”等概念的兴起,国内机器视觉公司如雨后春笋般发展起来,国内机器视觉产业高质量发展速度明显加快。
由OFweek行业研究中心最新出版的《2016-2020年中国工业机器视觉市场研究及预测报告》中指出,当前,国际机器视觉市场正处于产业成熟期,在诸如工业4.0等市场热点的推动下,未来3~5年欧美日机器视觉技术仍将有不停地改进革新,国际机器视觉市场规模有望继续增长。国内市场目前已处于产业成长期的加快速度进行发展阶段。
沈向洋指出,AI是近几年最火热的领域,“但我们离真正的人工智能,哪怕只是机器视觉这样一个分支,还有漫漫长路。我非常有信心,在接下来的几年,语音识别和视觉识别做得可以和人一样好。但是离开认知,离开真正的智能的话还有非常长的路需要走”。