2016年3月,在韩国首尔,一次特殊的围棋大战引起了上亿人的关注。Google旗下DeepMind公司研发的AlphaGo围棋人工智能程序挑战人类职业围棋选手、世界围棋冠军李世石九段,并以4:1的压倒性优势获得了胜利。
2016年末至2017年初,AlphaGo在中国棋类网站上以“大师”(Master)这一注册账号与中日韩数十位围棋高手进行快棋对决,连续60局无一败绩,取得60:0的辉煌战绩。
2017年5月,在中国乌镇围棋峰会上,AlphaGo以3比0的总比分战胜了排名世界第一的世界围棋冠军柯洁。在这次峰会期间,阿尔法围棋还战胜了由陈耀烨、唐韦星等五位组成的超豪华“世界冠军围棋团队”。
AlphaGo的棋力已超越人类职业围棋顶尖水平,这一事实已经获得围棋界公认。在GoRatings网站公布的世界职业围棋排名中,其等级分曾超过排名人类第一的棋手柯洁。
AlphaGo人机对战的节节胜利,让Google名利双收的同时,也在业界引爆了新一轮人工智能的热潮。各种关于人工智能的报道、评论及展望频频见诸报端和网络,很多AI术语时时萦绕在我们耳边:神经网络(Neural Network)、机器学习(Machine Learning)、深度学习(Deep Learning)。不少人对这些高频词汇的含义及其背后的关系总是似懂非懂、一知半解。
作为一个IT从业人员,相信我们大家整天都被人工智能(AI)、机器学习、深度学习等一些概念轰炸,有时候甚至有点诚惶诚恐。一方面,作为一个从事热门技术相关的“业内人士”而感到自豪;另一方面,觉得新概念一个接一个,作为业内人士的自己还不甚了解,有些失落和恐怖。下面我们就来解释下人工智能、机器学习、神经网络、深度学习等四个AI流行术语的含义和相互关系。
外围最大的一个圈用来表示人工智能,它除了包含机器学习,还包含非机器学习。所谓非机器学习就是人教机器学。过去叫专家系统。举个例子,如果我们设计智能驾驶无人车,就把“红灯停,绿灯行,黄灯亮了等一等”这些人类驾驶经验全部总结出,然后把情况和解决方法一一对应地输入到电脑中,就是告诉机器“若遇到这种情况,就那样处理”。现实问题是,人类驾驶过程中遇到的情况多到根本没办法穷尽,这条路最终证明走不通。所以,专家系统在 20世纪80年底热了一阵就冷下去了。
随着人类对计算机科学的期望慢慢的升高,要求它解决的问题越来越复杂,已经远远不能够满足人们的诉求了。于是有人提出了一个新的思路——能否不为难码农,让机器自己去学习呢?
机器学习就是用算法解析数据,不断学习,对发生的事做出判断和预测的一项技术。从大的分类来说,机器学习是现在人工智能的主流。不需要编写复杂的软件、确定特殊指令集、然后让程序完成特殊任务。它的特点是用大量历史数据和算法“训练”机器,让机器从数据中自己找规律,学会怎么样执行任务。正是因为要处理海量数据,所以大数据技术特别的重要,“机器学习”也是大数据技术上的一个应用。机器学习有五大流派,也就是符号主义,贝叶斯派、联结主义、进化主义、行为类比主义。
神经网络是机器学习的联结主义流派的核心方法,起源于神经科学,核心思想是对大脑进行仿真,也是现今最火的一个分支。考虑到人学习知识是通过大脑的神经元的连接来完成的。科学家通过模仿人脑机理发明了人工神经元,技术的逐步发展,多个神经元的连接,就形成了神经网络,神经元是构建神经网络的最基本单位。
为了让机器能够学习更多更复杂的东西,我们就需要用更多的神经元。人的大脑由1000亿个神经元构成,人脑神经元组成了一个很复杂的三维立体结构,三维太复杂,所以只能简化,我们就只能处理二维,神经元不能到处去连接,我们把它们分层,只允许每一层的神经元连接下一层的。
所谓神经网络就像上面这幅图,把很多神经元分为输入层、隐藏层和输出层,然后一层层连接起来。按照神经网络中间层(也就是隐藏层)的层数,可大致分为浅神经网络和深度神经网络。
多层的深度神经网络,我们就把它叫深度学习。理论上只要中间层神经元和连接足够多能做到任意复杂的事情,并且能得到更有意义的特征。近年来深度学习在计算机视觉、语音识别等领域十分流行,比如人脸识别、语言翻译等。
从上面的相关描述来看,人工智能、机器学习、神经网络、深度学习是逐个包含的关系。但今天大家用这四个术语的时候,大多数情况下说的是一回事,就是神经网络或深度学习。我们甚至可以说,这几年人工智能的大爆发,其实是神经网络的大发展,或是说深度学习的大飞跃。
人工智能的发展成为趋势已是必然,计算机视觉、机器学习、自然语言处理、机器人和语音识别是人工智能的五大核心技术,各个技术领域也将随之大放异彩,它们均会成为独立的子产业。
计算机视觉是指计算机从图像(或视频)中识别出物体、场景和活动的能力。计算机视觉技术运用由图像处理及别的技术所组成的序列,将图像(或视频)分析任务分解为便于管理的小块任务。比如图像分类、目标检测、图像分割、图像重构、图像生成等,还有视频分类、检测、生成,以及追踪等技术方向。
计算机视觉存在广泛的应用,这中间还包括:医疗影像检测被用来提高疾病预测、诊断和治疗;人脸识别被支付宝、高铁检票或者网上一些自助服务用来认证使用者的身份;视频监控分析能在安防及监控领域用来识别危险并预警;工业视觉检测能在智能制造环境下提升生产质量和效率;驾驶辅助/智能驾驶能促进车路协同的智能交通和智能车的快速发展。
机器学习指的是计算机系统无须遵照显式的程序指令,而只依靠数据来提升自身性能的能力。其核心在于机器学习是从数据中自动发现模式,模式一旦被发现便可用于预测。例如,把交易时间、商家、地点、价格及交易是否正当等信用卡历史交易数据用来训练机器学习系统,系统就会学习到预测信用卡欺诈的特征模式。训练的历史数据越多,预测就会越准确。
针对那些产生大量数据的活动,机器学习几乎拥有改进一切性能的潜力。所以,它在现在生活和工作中的应用场景十分普遍,包括交通预测、商品推荐、垃圾邮件过滤、石油和天然气勘探,智能客服以及公共卫生等。从技术领域来看,机器学习技术在计算机视觉、自然语言处理、机器人、语言识别等别的技术领域也扮演着重要角色,比如在计算机视觉领域,机器学习能在海量图像中通过不断训练和改进视觉模型来提高其识别对象的能力。
自然语言处理是研究能实现人与计算机之间用自然语言进行相对有效通信的各种理论和方法,是指计算机拥有人类般的文本处理的能力。实现人机间自然语言通信意味着要使计算机既能理解自然语言文本的意义,也能以自然语言文本来表达给定的意图、思想等。前者称为自然语言理解,后者称为自然语言生成。因此,自然语言处理大体包括了自然语言理解和自然语言生成两个部分。
一个自然语言处理系统用计算机对自然语言的形、音、义等信息做处理,即对字、词、句、篇章的输入、输出、识别、分析、理解、生成等的操作和加工。它对计算机和人类的交互方式有许多重要的影响。例如,自动识别一份文档中所有的时间、地点和人物;识别会议记录文档的核心议题;在一些合同文档中,将各种条款与条件提取出来并制作成可读性强的表格。以上这些任务通过传统的文本处理软件根本不可能完成。
最早的自然语言处理的应用领域就是机器翻译,能够将一种自然语言自动生成另一种自然语言。目前,谷歌翻译、百度翻译、搜狗翻译等翻译平台凭借其翻译过程的高效性和准确性占据了翻译行业的主导地位。此外,自然语言处理可以通过分析邮件中的文本内容,相对准确地判断邮件是否为垃圾邮件。它的应用领域还包括企业分析花了钱的人产品和服务的反馈信息,或者检测在线评论中的差评信息等;自动提取民事诉讼或政府调查中的某些含义,自动书写诸如企业营收和体育运动的公式化范文等等。
机器人将机器视觉、自动规划等认知技术整合至极小却高性能的传感器、制动器等硬件中,这就催生了新一代的机器人,它有能力与人类一起工作,能在各种未知环境中灵活处理不同的任务。也是最令人期待的AI子产业。
机器人的分类有很多种,从应用层面可以大致把它分为以下几个类别。第一,工业级机器人,像富士康这种生产流水线制造业企业已经应用得很好了,人力成本慢慢的升高,用工风险慢慢的升高,而机器人则能解决这样一些问题。第二,监护级机器人,它可以在家里或医院里作为老弱病残孕等特殊人群的护工,帮他们做一些复杂的事情。因为中国人口老龄化一直上升,对监护级机器人需求其实更迫切。第三,探险级机器人,用来采矿或者探险等,大大避免了人类操作所要经历的危险或根本做不到。除此以外还有用来打仗的军事机器人等。
语音识别就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。所以形象地把语音识别比作为“机器的听觉系统”。 语音识别技术最重要的包含特征提取技术、模式匹配准则及模型训练技术三个方面。语音识别技术使用一些与自然语言处理系统相同的技术,再辅以其他技术,比如描述声音和其出现在特定序列与语言中概率的声学模型等。同样要面对一些与自然语言处理类似的问题,比如不同口音的处理、背景噪声、区分同音异形/异义词等方面,同时还需要具有跟上正常语速的处理性能。
常见的语音识别应用系统有:语音输入系统(例如医疗听写、语音书写),相对于键盘输入方法,它更符合人的日常习惯,也更自然、更高效;语音控制管理系统,即用语音来控制设备的运行,相对于手动控制来说更方便快捷,可以用在诸如工业控制、语音拨号系统、智能家电、声控智能玩具等许多领域;智能对话查询系统(例如电话客服),按照每个客户的语音做相关操作,为用户更好的提供自然、友好的智能应答服务、检索服务等。
上述5大核心技术的产业化,是人工智能产业化的要素。AI将是一个万亿级的市场,甚至是更大量级的市场,将给我们大家带来一些全新且规模巨大的子产业,比如机器人、智能传感器、可穿戴设备等。据统计,近几年中国的AI创业公司排在前2位的技术领域分别是计算机视觉和机器人,分别占AI创业总数的20.8%和19.6%。
2015年7月,国务院出台《关于积极地推进“互联网+”行动的指导意见》,首次将AI纳入11个重点行动之一,推动中国人工智能步入新阶段。
2017年7月,国务院发布《新一代AI发展规划》,明确了我国新一代AI发展三步走战略目标,提出了六个方面重点任务,将AI上升到国家战略层面。
2017年12月,工业与信息化部印发了《促进新一代AI产业发展三年行动计划(2018―2020年)》,以信息技术与制造技术深层次地融合为主线,推动新一代人工智能技术的产业化与集成应用,从发展高端智能产品,夯实核心基础,提升智能制造水平,完善公共支撑体系和保障措施等方面详细规划了AI在未来三年的重点发展趋势和目标,操作性和执行性很强,在产业界引起了较大反响。
近年来,人工智能快速地发展,作为引领新一代科技革命和产业变革的战略性技术,人工智能正深刻影响社会生活、改变世界,在引发巨大变革的同时,也带来了诸多风险,人工智能该如何健康发展?2019年6月,我国首次提出人工智能治理原则,发布了《新一代人工智能治理原则——发展负责任的人工智能》政策。
2020年3月,中央政治局常务委员会召开会议提出,加快5G网络、数据中心等新型基础设施建设进度。新型基础设施建设(简称,新基建)最重要的包含5G基站建设、特高压、城际高速铁路和城市轨道交通、新能源汽车充电桩、大数据中心、人工智能、工业互联网七大领域,涉及诸多产业链。AI是新基建的七大主要领域之一。
2020年6月,全国人大常委会中提及人工智能相关法律和法规问题,提到要加强立法理论研究,重视对AI、区块链、基因编辑等新技术新领域相关法律问题的研究。
《规划》将AI上升到国家战略层面,确立了新一代AI发展的战略目标是分三步走:
第一步,到2020年人工智能总体技术和应用与世界领先水平同步,AI产业成为新的重要经济增长点,人工智能技术应用成为改善民生的新途径,有力支撑进入创新型国家行列和实现全面建成小康社会的奋斗目标。
第二步,到2025年人工智能基础理论实现重大突破,部分技术与应用达到世界领先水平,AI成为带动我国产业升级和经济转型的主要动力,智能社会建设取得积极进展。
第三步,到2030年人工智能理论、技术与应用总体达到世界领先水平,变成全球主要AI创新中心,智能经济、智能社会取得明显成效,为跻身创新型国家前列和经济强国奠定重要基础。
相较于国外,我国高校人工智能培育起步较晚,但近年来我国在人工智能学科和专业快速推进,多层次地促进人工智能人才教育培训体系的建成。
2018年4月,教育部发布的《高等学校AI创新行动计划》提出,加强AI领域专业建设。推进“新工科”建设,形成“人工智能+X”复合专业培养新模式,到2020年建设100个“人工智能+X”复合特色专业;到2020年建立50家人工智能学院、研究院或交叉研究中心。2019年,全国共有上海交通大学、南京大学、武汉理工大学等35所高校获得首批人工智能专业建设资格。2020年3月,教育部再次审批通过180所高校开设人工智能专业。
2020年1月,教育部、国家发改委和财政部联合印发《关于“双一流”建设高校促进学科融合 加快AI领域研究生培养的若干意见》,提出深化人工智能内涵,要构建基础理论人才与“人工智能+X”复合型人才并重的培养体系,探索深层次地融合的学科建设和人才教育培训新模式,着力提升人工智能领域研究生培养水平,为我国抢占世界科学技术前沿,实现引领性原创成果的重大突破,提供更充分的人才支撑。
2020年3月,科技部、教育部、发改委等部门印发《加强“从0到1”基础研究工作方案》,充分的发挥基础研究对科学技术创新的源头供给和引领作用,解决我国基础研究缺少“从0到1”原创性成果的问题,提出要加强基础研究人才培养。
从频频颁布的国家政策可发现,我国人工智能人才政策逐渐重视培养人工智能基础层人才与复合型人才。
最近聊天中,听到一哥们侃侃而谈:现在的互联网+,除了打车,其它都是扯谈,没啥用。面对人工智能的大潮,我相信很多人都是熟视无睹,都在这样忽视着AI时代已悄然来临的事实。毕竟,从事数据行业的人还是少数,更别说真正理解数据的人了。
作为计算机专业的大学生,应该算是AI相关的“从业人员”了,我们不仅要了解它,更要掌握“AI时代”的知识和技能。实际上,我们要谈的不是一个高深复杂的AI技术问题,而是一种思维转变,毕竟,时代抛弃你,连声招呼都不会打。返回搜狐,查看更加多