机器学习的实施是一项很复杂的工作,企业往往需要专家人才和数据科学家来有明确的目的性地开发,对于大部分勇于探索商业模式的公司是很难应用机器学习的。
“在中国,慢慢的变多的公司在探讨机器学习和人工智能的潜力,我们思考怎么样把这些技术融入到日常应用当中。”AWS全球副总裁及大中华区执行董事张文翊表示,若能去除机器学习涉及的混乱和复杂性,把构建、训练和部署模型的工作简单化,将能让人工智能走进更普通的企业。
日前,亚马逊云服务(AWS)在中国发布Amazon SageMaker,一项完全托管的服务,能够在一定程度上帮助开发者和数据科学家快速地规模化构建、训练和部署机器学习 (ML) 模型。
据介绍,制约人工智能大范围的应用的因素有三个方面:一是掌握人工智能专业相关知识的人才不足;二是构建和扩展人工智能的技术产品有难度;三是在生产经营中部署AI应用费时且成本高。最后导致缺乏低成本、易使用、可扩展的AI产品和服务。
业内人士表示,开发者和数据科学家首先必须对数据来进行可视化、转换和预处理,这一些数据才能变成算法能够正常的使用的格式,用以训练模型。即使是简单的模型,企业也要消耗庞大的算力和大量的训练时间,并在大多数情况下要招聘专门的团队来管理包含多台GPU服务器的训练环境。从选择和优化算法,到调节影响模型准确性的数百万个参数,训练模型的所有阶段都需要大量的人力和猜测。然后,在应用程序中部署训练好的模型时,客户又需要另一套应用设计和分布式系统方面的专业技能。并且,随着数据集和变量数的增加,模型会过时,客户又必须一次又一次地重新训练模型,让模型从新的信息中学习和进化。所有这些工作都需要大量的专业相关知识,并耗费庞大的算力、数据存储和时间成本。而且,由于没有集成化的工具用于整个机器学习的工作流,机器学习模型的传统开发方式是复杂、繁复和昂贵的。
“SageMaker首先从英文上来说,Sage是魔法的意思,SageMaker就是一个魔法的生成器,就是完全托管的机器学习的服务。”AWS首席云计算企业战略顾问张侠解释,它会引导应用开发工程师需要的时候给你提供所有的云上工具,并指导整一个流程,包括从数据的准备、建立、训练调优、部署管理。
“算法的构建和模型训练不要求我们在本地投资昂贵的计算硬件,一切都是在云端以按需使用的方式完成。与行业通用的公开算法不同,更重要的是我们自己训练的模型在应用场景中具有更多个性化空间,并且我们对自己训练出的模型具有知识产权,这将是我们未来的核心竞争力。”天津华来科技有限公司云业务部总监季宝平说。
“在这样的平台上,我们用了三个月的时间就完成了总系统的搭建。与自主构建模型相比,通过训练阶段使用Amazon EC2的Spot实例(竞价实例)能节约70%的费用。”大宇无限首席技术官苏映滨说,“在大宇无限的产品中实现视频内容的在线推荐,对我们的开发团队来说是一个巨大的挑战。构建机器学习系统的整一个流程极为复杂,需要大量的开发者耗费很长的时间才有机会完成。Amazon SageMaker极大地简化了机器学习系统的构建、训练和部署流程。”
那么,在使用Amazon SageMaker之后,人才短缺的问题会不会得到很好的解决?AI人才会不会还是高薪难求的局面?企业需求的人才门槛是不是有所降低?
“对于企业用人门槛而言,客观来说确实是有降低,一般的工程师相对不用特别高的经验,进来的时候通过一个快速的培训,其实他能够很快的用得上手,还是需要一些比较资深有经验的候选人。在AI人才支出方面,相对而言,我们整体的在人力上的投入是确实会少。”苏映滨对科技日报记者表示,企业用人招聘会更注重人才自身的基础能力和业务经验,因为进入企业之后,新晋技术人员要对Amazon SageMaker平台的使用进行学习,重新熟悉整套系统。