< 特斯拉怎么样去使用计算机视觉技术解决无人驾驶难题_智慧地灾_华体育app官网登录|华体会手机版
2023-12-25 智慧地灾

  深圳市人工智能行业协会,全国首家人工智能行业协会,深耕AI领域产学研对接、行业政策解读、项目申报信息等,持续围绕人工智能各个发展领域基础技术及行业应用,推动技术成果转化,引领行业发展。

  北美时间2022年9月30日,特斯拉CEO埃隆·马斯克在美国加州帕罗奥图举办了人工智能日(AI Day)活动,活动展示了特斯拉在AI领域多个角度的研究成果。其中,特斯拉新研制的名为“Optimus”机器人原型机的全球首秀,成为了全场最受关注的焦点。

  特斯拉的Optimus机器人在舞台上展示了其行走、跳舞、搬运物件、拿起水壶浇花等能力,吸引了许多观众的目光。虽然也有部分人对Optimus外露的机器零件以及一般的运动能力产生了质疑,但是,仅从活动中机器人所展示的几个灵活动作就能看出目前Optimus已能对周围环境和物体进行初步的识别,并且做出合理的决策和行为动作。据悉,Optimus可能在3-5年间即可量产上市,产量应该能达到数百万台。

  Optimus的一系列行为得益于特斯拉始终致力于研究无人驾驶系统,这个系统也就是Optimus的“大脑”。他们除了将无人驾驶系统应用于汽车外,还把无人驾驶系统应用于他们的智能机器人当中。活动期间,特斯拉技术人员就解释道:机器人的控制管理系统在本质上和特斯拉汽车上完全无人驾驶电脑是一样的。马斯克本人也提到:特斯拉使用与自动驾驶系统相同的过程来链接数据并部署网络。这说明该机器人的控制管理系统搭载的是与汽车相同的FSD(Full Self-Driving,无人驾驶)软件,所以在某些特定的程度上可以认为,对于特斯拉而言,智能机器人和汽车的区别也仅仅在于汽车底部是轮子,而机器人的底部则是机械肢体。

  根据驾驶员与车辆之间的互动,无人驾驶系统可分为五个层级:驾驶员辅助、部分无人驾驶、有条件无人驾驶、高度无人驾驶和完全无人驾驶。特斯拉的无人驾驶系统属于完全无人驾驶,这是五个层级中最高层级的无人驾驶形态,仅通过系统就能操控全局,在任何情况下都无需驾驶员对车辆进行监测和操作。当然,由于使用场景和使用需求的不同,智能机器人神经网络的训练方式和训练资料还是和汽车有所差别,但不论是汽车还是机器人,其无人驾驶功能均是体现系统的感知能力、决策能力和行为能力。其中,对复杂动态环境的感知能力建设是实现无人驾驶功能的主要技术难题。

  当前无人驾驶在感知技术上分为两个分支,分别是计算机视觉技术和激光雷达技术,特斯拉的自动驾驶系统则采用的是前者。

  计算机视觉技术是人工智能主要技术之一,也是目前自动驾驶在感知识别方面的核心技术。深圳市人工智能行业协会对计算机视觉技术的定义是使用计算机模仿人类视觉系统的科学,让计算机拥有类似人类提取、处理、理解和分析图像以及图像序列的能力,具有速度快、精度高、成本低等优点。一般来说,计算机视觉系统由图像采集、图像处理及分析、图像显示输出等组成。随着深度学习算法出现,计算机视觉技术进入了一个新阶段。计算机视觉通过深度学习形成神经网络,模仿人类视觉系统来进行图像配准、处理和分析。神经网络在进行过大量训练资料的训练后,能形成计算机视觉模型,可以开展对象的分类、监测、识别与跟踪,具有强大的特征学习和表示能力。

  毫无疑问,特斯拉无人驾驶系统研究团队正是通过人工智能的深度学习算法对其自动驾驶系统的神经网络模型进行训练。在过去的一年内,特斯拉就训练了近75000个神经网络模型,通过评估、筛选等方式选取少数的最优模型置入其FSD软件当中,以提升驾驶性能。此外,特斯拉也在逐渐完备训练资料,以改进神经网络模型。他们的训练资料包含了无数个由不同片段组成的训练集构成,每个训练集代表一种汽车运动的信号。也就是说,神经网络系统要学习怎么样在各种不同的汽车运动信号出现后做出正常反馈。例如,在一个有停放车辆的路口转弯的场景,系统要对路边停放车辆进行识别,判断其是静止或是正在移动,并控制所在车辆前进或减速。光是针对路口转弯时路边停放车辆的识别,特斯拉就单独选取了126种极具代表性的视频片段纳入当中,作为一个训练集。同时,特斯拉通过不断添加和更新数据来完善程序语义,提高数据引擎适用性,并不断更正修复其中的视频片段以降低模型对实际场景做出的错误预测,提升系统感知识别的正确率。在智能机器人的运行上,系统的神经网络则主要是通过对捕捉到的不同环境下的人体行为动作进行学习,模仿人类活动。例如,Optimus通过对人类浇花的图像和动作进行学习,可以在一个实际的环境中自主识别出浇花用的水壶,并且做出浇花这一行为。

  深圳市AI行业协会认为,当前利用计算机视觉技术,已能在某一些程度上辅助、部分代替甚至完全代替人类完成一些基础类型的工作。虽然目前在自动驾驶领域,计算机视觉的逻辑模型并未达到理想化的状态,仍存在一定的缺陷,但随着深度学习算法的不断更迭和优化,由神经网络构建的计算机视觉模型将会更具有适用性和准确性,在未来,计算机视觉技术将会有更广阔的发展空间,落地应用于更多领域的场景之中。

  投资者关系关于同花顺软件下载法律声明运营许可联系我们友情链接招聘英才使用者真实的体验计划

  不良信息举报电话举报邮箱:增值电信业务经营许可证:B2-20090237

CONTACT US
欢迎随时与我们联系