快捷搜索:  创意文化园  1864  1957  as  1877  1956  1959  2067

全民自动驾驶5年内真的会来吗?这是Lyft的自动驾驶2.0

新2代理网址

www.22223388.com)实时更新发布最新最快最有效的新2网址和新2最新网址,包括新2手机网址,新2备用网址,皇冠最新网址,新2足球网址,新2网址大全。

,

机械之心报道

编辑:杜伟、小舟

已往十年,只管机械学习已经在图像识别、决议制订、NLP 和图像合成等领域取得许多乐成,但却在自动驾驶手艺领域没有太多希望。这是哪些缘故原由造成的呢?克日,Lyft 旗下 Level 5 自动驾驶部门的研究者对这一问题举行了深入的探讨。他们提出了自动驾驶领域的「Autonomy 2.0」看法:一种机械学习优先的自动驾驶方式。

论文地址:https://arxiv.org/pdf/2107.08142.pdf

自 2005 至 2007 年的 DARPA 超级挑战赛(DARPA Grand Challenge,由美国 DARPA 部门出资赞助的无人驾驶手艺大奖赛)以来,自动驾驶汽车(SDV)就已经成为了一个活跃的研究领域,并经常成为头条新闻。许多企业都在起劲开发 Level 4 SDV,有些企业已经在该领域耕作了十多年。

已经有一些研究展示了小规模的 SDV 测试,虽然许多展望都以为「仅需要 5 年就可以迎来无处不在的 SDV 时代」,但应看到生产级的部署似乎依然遥不能及。鉴于生长历程受限,我们不能阻止地会遇到一些问题,好比为什么研究社区低估了问题的难题度?当今 SDV 的生长中是否存在一些基个性的限制?

在 DARPA 挑战赛之后,大多数业内介入者将 SDV 手艺剖析为 HD 舆图绘制、定位、感知、展望和设计。随着 ImageNet 数据库带来的种种突破,感知和展望部离最先主要通过机械学习(ML)来处置。然则,行为设计和模拟很洪水平上仍然基于规则,即通过人类编写的越来越详细的关于 SDV 应若何驱动的规则实现性能提升。一直以来有种说法,在感知异常准确的情形下,基于规则的设计方式可能足以知足人类水平的显示。这种方式被称为Autonomy 1.0

图 3:Autonomy 1.0 的典型手艺客栈,展示了各个组件中使用到的 ML 数目。从图中可以看到,感知和展望组件是基于 ML 的,但设计和模拟依然依赖于非扩展、基于规则的系统。

然则,生产级的性能需要大规模地扩展以发现和稳健处置小概率事宜的「长尾效应(long tail)」。研究者以为 Autonomy 1.0 无法实现这一点,缘故原由有以下三点:

一是基于规则的设计器和模拟器无法有用地建模驾驶行为的庞大度和多样性,需要针对差其余地理区域举行重新调整,它们基本上没有从深度学习手艺的希望中获得增益;

二是由于基于规则的模拟器在功效上受限,因此评估主要通过路测完成,这无疑延迟了开发周期;

三是 SDV 路测的成本高昂,且扩展性差。

因此,针对这些扩展瓶颈,研究者提出将整个 SDV 客栈转酿成一个 ML 系统,而且该系统可以使用包罗多样化且真实的人类驾驶数据的大规模数据集来训练和离线验证。他们将这个 ML 系统称为Autonomy 2.0,它是一个数据优先的范式:ML 将客栈的所有组件(包罗设计和模拟)转化为数据问题,而且通过更好的数据集而不是设计新的驾驶规则来实现性能的提升。这样做极大地释放了处置小概率事宜长尾效应和扩展至新的地理区域所需要的扩展性,唯一需要做的是网络规模足够大的数据集并重新训练系统。

Autonomy 1.0 与 Autonomy 2.0 的开发流程对比,可以看到 Autonomy 1.0 的可扩展性低、SDV 行为由工程师赋予、验证方式为路测、硬件成本高,而 Autonomy 2.0 的可扩展性高、SDV 行为从人类驾驶中学得、验证方式为离线模拟、硬件成本在可肩负局限内。

不外,Autonomy 2.0 也面临着以下几项主要挑战:

将客栈示意为端到端可微网络;

在闭环中行使机械学习的模拟器举行离线验证;

网络训练这些模拟器需要大量人类驾驶数据。

Autonomy 2.0

Autonomy 2.0 是一种 ML 优先的自动驾驶方式,专注于实现高可扩展性。它基于三个要害原则:i) 闭环模拟,即模子从网络的真实驾驶日志中学习;ii) 将 SDV 剖析为端到端的可微分神经网络;iii) 训练设计器和模拟器所用的数据是使用商品传感器大规模网络的。

数据驱动的闭环反映模拟

Autonomy 2.0 中的大部门评估都是在模拟中离线完成的。基于规则的模拟具有一些局限性,这与 Autonomy 1.0 对路测的依赖形成鲜明对比。但这并不意味着 Autonomy 2.0 完全放弃了路测,不外其目的在开发周期中不太突出,主要用于验证模拟器的性能。为了使模拟成为开发蹊径测试的有用替换品,它需要三个属性:

适用于义务的模拟状态表征;

能够以高保真度和壮大的反映能力合成多样化和真切的驾驶场景;

应用于新的场景和地域时,性能随着数据量的增添而提升。

模拟效果必须异常真实,由于模拟和现实之间的任何差异都市导致性能估量禁绝确,但它不需要是照片般真切的 [29],而是只关注设计器的示意。该研究推断,为了到达高水平的真实感,模拟自己必须直接从现实天下中学习。最近,[28] 展示了若何使用鸟瞰图示意从先前网络的真实天下日志中构建真切的和反映性的模拟。如图 4 所示,然后可以部署此模拟将任何日志转换为反映式模拟器,用于测试自动驾驶战略。

2022世界杯8强www.9cx.net)实时更新比分2022世界杯8强数据,2022世界杯8强全程高清免费不卡顿,100%原生直播,2022世界杯8强这里都有。给你一个完美的观赛体验。

从人类演示中训练出来的完全可微的客栈

Autonomy 1.0 具有手工设计的基于规则的组件,以及感知、展望、设计和模拟之间的人类可注释接口。与 之差异,Autonomy 2.0 客栈完全可以通过人类演示举行训练,因此其庞大性与训练数据量成正比。为了训练这样一个系统,需要知足几个条件:

每个组件,包罗设计,都需要可训练且端到端的可微分;

可使用人工演示举行训练;

性能与训练数据量成正比。

下图 5 是完全可微的 Autonomy 2.0 客栈架构,可以从数据举行端到端的训练,而无需设计单个块和接口。其中, d、h、f 和 g 是可学习的神经网络。d 和 h 给出了设计发生的场景的潜在示意。f 代表 SDV 和场景中署理的战略。g 是状态转移函数。I_0 是网络的输入,而 在训练时代提供监视。

大规模低成本数据采集

到现在为止讨论的系统使用人类演示作为训练数据,即具有由人类驾驶员选择的响应轨迹的传感器数据作为监视。要解锁生产级性能,这些数据需要具备:

足够的规模和多样性以包罗罕有事宜的长尾;

足够的传感器保真度,即用于网络数据的传感器需要足够准确才气有用地训练设计器和模拟器;

足够廉价,可以以这种规模和保真度网络。

虽然最近第一个带有人类演示的公然数据集已宣布,但这些数据仅限于几千英里的数据。考察长尾可能需要网络数亿英里的数据,由于大多数驾驶都是平安无事的,例如在美国,每百万英里约莫有 5 起撞车事故 。

应该使用哪些传感器呢?感知算法的最新希望解释,在 KITTI 基准测试 [44] 上,高清和商用传感器(如相机 和希罕激光雷达 [42])之间的感知精度差距缩小了,如下表 1 所示。

表 1:网络数据时面临传感器可扩展性和保真度之间的权衡,这会直接影响感知精度。

未来需要解决哪些问题

研究者概述了 Autonomy 2.0 的范式,旨在使用 ML 优先的方式解决自动驾驶问题。而且,通过消除人在回路(human-in-the-loop),这一范式的扩展性更强,这也是实现高性能自动驾驶汽车手艺的主要痛点。虽然 Autonomy 2.0 范式的生长远景很好,但依然有需要解决的问题,详细如下:

模拟和设计的适当状态示意是什么?我们应若何权衡场景概率?

我们应若何检测异常值(outlier)以及从未见过的情形(case)?

与使用搜索举行的实时推理相比,通过人类演示举行离线训练的极限在那里?

我们需要在模拟上投入若干?又应若何权衡离线模拟自己的性能?

我们在训练高性能设计和模拟组件上需要若干数据?在大规模数据网络时又应该使用什么传感器呢?

解答这些问题对于自动驾驶和其他现实天下的机械人问题至关主要,而且可以引发研究社区尽早解锁高性能 SDV。

数据智能手艺实践论坛――从数据到知识的「智变」

8月27日15:00-17:00,百分点科技与机械之心团结举行「数据智能手艺实践论坛」全程线上直播,四位业界专家与学者详细解读多模态数据融合治理、盘算机视觉、基于知识图谱的认知智能、知识图谱构建等领域的手艺希望和实践心得。

演讲一:融合创新――盘算机视觉手艺与产业化生长之道

演讲二:从「治」理到「智」理,多模态数据治理PAI应用方式论

演讲三:从知识图谱到认知智能

演讲四:知识图谱手艺及行业应用实践

直播设有QA环节,迎接加群交流答疑。

THE END

发表评论
sunbet声明:该文看法仅代表作者自己,与本平台无关。请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
用户名: 验证码:点击我更换图片

您可能还会对下面的文章感兴趣: