当今时代,处于第三波浪潮的AI正迎来加速发展时期,AI技术不断突破,应用大规模爆发,大量布局AI的科技巨头和勇于探索商业模式的公司逐渐涌上潮头。
而计算机视觉作为AI市场的最大分支,无论是在技术成熟度、商业化进程,还是在市场上涨的速度、投融资热度等方面,自始至终都是AI领域最热门的行业之一。
计算机视觉的应用领域几乎涵盖了我们所知的所有行业,如无人驾驶、金融风控、安防、新零售、智能手机、智能机器人......
据IDC预测,中国AI市场将在2024年形成千亿市场规模,而计算机视觉占比将超过一半,未来广阔前景引人遐想。
人工智能大家已经耳熟能详,但计算机视觉在排除行业从事者之外,却很少有人能解释的清楚。
简单来说,人类通过眼睛感知和理解周边的世界,而计算机视觉则是一门研究怎么样使机器“看”的科学。更进一步的说,就是用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。
20世纪60年代,贝尔实验室研发的一种将光子转化为电脉冲的器件,很快成为了高质量数字图像采集任务的新宠,逐渐应用于工业相机传感器,标志着计算机视觉走上应用舞台;70年代中期,MITAI实验室正式开设计算机视觉课程;1982年,《视觉》一书的问世,标志着计算机视觉成为了一门独立学科。
进入21世纪以来,计算机视觉领域蒸蒸日上,各种理论与方法大量涌现,并在多个核心问题上取得了令人瞩目的成果。尤其是近年来,国内外巨头纷纷布局计算机视觉领域,开设计算机视觉研究实验室,并以计算机视觉新系统和技术赋能原有的业务,开拓全新战场。
图像分类是根据图像的语义信息对不同类别图像进行区分,是计算机视觉的核心,是物体检测、图像分割、物体跟踪、行为分析、人脸识别等其他高层次视觉任务的基础。例如通过图像分类,计算机识别到图像中有人、树、草地、天空等等。
图像分类在许多领域都存在广泛的应用,如:安防领域的人脸识别和智能视频分析等,交通领域的交通场景识别,互联网领域基于内容的图像检索和相册自动归类,医学领域的图像识别等。
目标检测任务的目标是给定一张图像或是一个视频帧,让计算机找出其中所有目标的位置,并给出每个目标的具体类别。如下图,以识别和检测人为例,用边框标记图像中所有人的位置。
而在多类别目标检测中,通常用不同颜色的边框对检测到的不同物体的位置进行标记,如下图所示。
语义分割是计算机视觉中的基本任务,在语义分割中我们需要将视觉输入分为不同的语义可解释类别。它将整个图像分成像素组,然后对像素组进行标记和分类。例如,我们可能需要区分图像中属于汽车的所有像素,并把这些像素涂成蓝色。比如把图像分为人(红色)、树木(深绿)、草地(浅绿)、天空(蓝色)标签。
实例分割是目标检测和语义分割的结合,在图像中将目标检测出来(目标检测),然后对每个像素打上标签(语义分割)。如以人为目标,语义分割不区分属于相同类别的不同实例(所有人都标为红色),实例分割区分同类的不同实例(使用不相同颜分不同的人)。
目标跟踪是指对图像序列中的运动目标进行仔细的检测、提取、识别和跟踪,获得运动目标的运动参数,做处理与分析,实现对运动目标的行为理解,以完成更高一级的检测任务。
×分享到微信朋友圈打开微信,点击底部的“发现”,使用“扫一扫”即可将网页分享至朋友圈。
《静音》是一部 Netflix 电影。尽管 Netflix 过去一年在原创电影上的表现并不如预期,但是《静音》仍让人颇为期待
最近,美国最大的经济研究机构——全国经济研究所(NBER,全美超过一半的诺奖经济学得主都曾是该机构的成员)发布了一份报告,全面分析了 1990 到 2007 年的劳动力市场情况。\n
坏机器人制片公司最新的一部电影名为《霸主》(overlord),背景设置在二战时期,很可能是一部在半遮半掩中秘密制作的科洛弗电影系列。
我们都知道,到处都在重启;我们也知道,如果有钱,啥都能重启。所以,会不会被重启算不上是个问题,只能问何时会被重启。自然而然地,世界各地的各种重启现象衍生出了一个有趣的猜猜游戏:哪一部老作品会是下一个接受这种待遇的?\n