世界现行的经济秩序确实就是美国,欧盟,日本等发达国家建立起来的,包括全球分工,贸易规则,结算货币等等。欧美国家躺在这套体系上享福享了几十年,将剩余的国家分成能源供给国,资源供给国,劳动力国家,消费倾销市场国家等等。不可否认,美国将中国也只不过定义为劳动力国家和消费市场而已。问题就在于中国崛起了,传统赚钱的行业迅速更替,互联网,人工智能,无人机,电商等全新模式兴起,商业逻辑变了,中国成了引领者,欧美成了落后者。旧秩序该变了,新引领者该出现了。#财经#

#早安心语# 永远不要放弃你真正想要的东西。

等待虽难,但后悔更甚。

人生需要做到这几点:
人生总是有输有赢,
得势顺境时,千万不要得意忘形,放纵自己;
失势逆境时,千万不可消极颓唐,放弃自己;
人生成功的定义,要自己去找,
别迷失在别人的看法中。

世界上没有不劳而获的成功,
任何成功都需要经过磨炼,
只有付出才会有收获。

早安,不言放弃的你。

特斯拉autopilot研发总监Ashok在CVPR2022上的演讲:如何检测障碍物并自动避让(中)

原创 瓦砾村钱罐 瓦砾村夫

今天,我想谈一谈在视频中没有展示的某个技术,那就是,我们如何处理一般障碍物。

当开始搭建我们更高级的技术栈时,我们想用某种方法来表示一般障碍物。我们一开始使用的是图像空间的分割方法,这几乎是个标准方法。这里,图像空间的每个像素,都被标记为可驾驶或不可驾驶。然后,我们希望规划技术栈可以使用这个信息来导航场景。

但这种方法有几个问题。首先,这些关于某个像素是否可驾驶的预测是在图像空间中完成的,基于图像的uv值,或者说,某个像素是可驾驶的像素,还是不可驾驶。但为了让汽车能够在三维世界中导航,它需要在三维空间中进行预测,这样才能建立互动的物理模型,并处理驾驶任务。

但在从图像空间转变到三维空间的过程中,如果采用这样的方式,像素分割会在系统中产生不必要的瑕疵或不必要的噪声。例如,取决于我们如何将这个图像空间转换到三维空间,图像中地平线上的像素可能会产生巨大的影响。而我们不希望规划技术栈处理带有如此多噪声的可驾驶空间。而这其实并不是一个根本性的局限,只是这种表示方式的局限。

另外,这种表示方式也不能提供场景完整的三维结构,因此很难推理出所有悬空的障碍物,或者墙壁,或者其他可以遮挡场景的物体。

对一般障碍物进行建模的另一个方法,是使用密集的深度信息。在这个任务中,你可以以像素为基础,让网络预测深度,这样每个像素都会产生某个深度值。

但是,尽管这些深度图在颜色空间中进行可视化时,看起来非常漂亮,但当你使用深度值,把射线反向投影计算得到三维点,并可视化这些三维点云时,虽然它们在近处看起来很不错,但随着距离的增加,它们就变得不一致,而且数据很难被后续流程所使用。例如,局部的深度变得不一致,因此,墙就不直了,可能是弯弯扭扭的。

这个方式也有同样的问题,即靠近地平线的物体只由很少的点来表示,这使得规划技术栈很难针对障碍避让编写合理的逻辑。

这些深度图是基于每个摄像机的图像平面生成的,这也使得这个方法很难生成一个汽车周围统一的三维空间。

由于深度图通常被建模为回归目标,很难通过遮挡来进行预测,而且由于网络的特性,边界上也很难进行预测,例如,它们可能会平滑的从车辆变为背景,而这会在三维空间中产生不必要的瑕疵。

对于这个问题,我们的解决方案就是我们内部所称的占用网络(occupancy network)。下面是一个使用我们的占用网络进行预测的例子,我在这里停一下,让你们看看预测结果。

这些占用网络接收所有八个摄像机流作为输入,并生成一个汽车周围空间的体积化的占用值。每一个体素(或汽车周围的每一个位置),网络都会生成该体素是否被占用的结果。事实上,它生成了一个该体素(或三维位置)被占用或不被占用的概率值。

如我所说,它接受所有8个摄像头作为输入,并生成了一个单一的体积化的输出。这个输出的产生,并不是通过拼接各个独立的预测结果完成的,而是网络完成所有的内部传感器融合,并产生一个单一的一致的输出空间。

这些网络能生成静态物体的占用值,比如墙壁和树木之类的东西,也能生成移动物体的动态占用值,比如车辆(大多数情况下),但有时,也包括其他移动的障碍物,如道路上的碎片。

由于输出空间直接是在三维空间中,我们可以通过遮挡来进行预测。你可以预测一条曲线的存在,尽管它可能暂时被汽车遮挡。

最后,这个方法在内存和计算方面都非常高效,尽管表面上看可能并非如此,因为它生成了密集的三维的占用值,看起来可能体积过于庞大。但最终,在内存和计算效率上,这是一种更优的方法,因为它把分辨率分配在那些关键的地方。

如我所说,密集的深度图,或图像中的可驾驶空间,远处的分辨率非常低,而近处的分辨率非常非常高。但在占用网络中,在与驾驶有关的所有体积中,分辨率几乎都一致,这让它变得极其高效。

例如,我向各位展示的网络,在我们的计算平台上运行的时间小于10毫秒,这使得网络可以以100赫兹的速度运行,比摄像机产生图像的速度快得多。

这是如何做到的?让我们简单了解一下架构。

这里我展示了几个摄像流:鱼眼摄像头,这是一个朝向正面的广角摄像头;左立柱摄像头,这是一个面向左边的摄像头。而网络的确获取所有的摄像机作为输入。

我们首先进行归一化处理,以移除所有跟特定车辆相关的配置,比如内部校准,或图像畸变,或类似的因素。

一旦进行了归一化处理,这些图像就会被输入到目前最先进的图像主干架构中。例如,这里我们采用regnets和BiFBNs来提取图像特征,但这可以换成最先进的架构,甚至是来自于CVPR2022的。

这些主干在图像空间中生成了高维特征,但我们希望占用值定义在三维空间中,对吧,怎样才能做到呢?

我们使用基于查询的注意力(attention),来生成这些三维的占有值特征。这其实与几年前一篇同名论文《占有网络》的出现颇为相似,那篇文章也是查询一系列三维点,以确定三维点是否被占用。

这里的网络也有类似的性质,我们接受三维的位置编码,然后将其映射为固定的查询。这些固定的查询然后参与我们每一个图像空间的特征,我们在图像空间中也嵌入了位置信息。这样,这些三维查询参与所有图像流的图像空间查询,然后生成三维的占用特征。

因为这些都是高维特征,很难在空间的每个点上直接进行计算。我们采用的方法,是在较低的分辨率下生成这些高维特征,然后使用典型的上采样技术,如反卷积(deconvs),来生成更密的高分辨率占用值。

有趣的是,当我们开始这个项目的时候,我们最初的目标是只处理静态物体,如墙或树。因为我们有很多不同的神经网络在车内运行,处理不同类型的障碍物,我们并没有继续搭建一个主要处理移动物体的网络,如车辆,行人,自行车手等。

而这些网络也生成了车辆的完整运动学数据,如深度,速度,加速度,动力等。我们有这个移动物体的网络,我们当时想,好的,我们这里不需要处理移动物体,我们只需要处理静态物体,如树,墙等。

但事实证明,很难生成显式定义的本体树。在这个例子中,这也是来自我们自己内部的测试:这里有一辆皮卡车,看起来像一个栅栏。


发布     👍 0 举报 写留言 🖊   
✋热门推荐
  • 机械钟维修,德国挂钟及进口挂钟维修,北京朝阳区东四环中路195号华腾新天地商场2层科霸钟行,67729331(大郊亭桥南500米四环内侧)停车方便。专业修理机械
  • 表情包来源见水印)我没有办法想象跟一个不喜欢的人结婚,即使在家人满意的目光之中,经历了一场盛大的婚礼之后满场的灯光熄灭,人群散场,你激动的心绪平复下来巨大的空虚
  • 我们满怀期待的踏入婚姻,期待成为妈妈之时,所有人都祝福着,当我成为妈妈那一刻就意味着牺牲和付出,他的到来是我生命的新篇章,我有了妈妈的角色,我可能需要24小时都
  • [泪]还有就是你的橘子从哪里买的 简直了 太好吃了[泪]如果你看到一定一定要找我呀[爱你]真的是好漂亮好有礼貌的一个小美女欧~祝你天天开心~-5:00 p.m.
  • 斩获天猫金妆奖,丝绒镜面轻薄质地,限定6大微醺特调全新色号,一见倾心的瞬间~【限定前3000支!斩获天猫金妆奖,丝绒镜面轻薄质地,限定6大微醺特调全新色号,一见
  • #阳光信用[超话]##每日一善##实时号测试# 把懒惰放一边,把丧气的话收一收,把积极性提一提,把矫情的心放一放,所有想要的,都得靠自己的努力才能得到。#阳光信
  • 真实又感人是我对这部电影的最大感受,《您好,北京》让我们更加了解北漂人的心理变化过程,年轻时的梦想和年长后的无奈和妥协是必经的道路,但在这座造梦之城里,每一个小
  • 一开始,直播带货的成交额非常少,几乎入不敷出;渐渐地,李国麟掌握了诀窍,开始发布短视频作品,为了吸引流量,他特意扮成鸠摩智的模样,唤起大众的怀旧回忆。 罗
  • 一个懂得尊重别人的人,无论在什么时候,不管什么场合,都不会嘲笑别人的缺点,也不会宣扬别人的隐私,顾及别人的情绪和尊严。如果这个位置有疤痕或者破损的话,那么与子女
  • :你不是说你大学不想谈恋爱的嘛~嘿嘿嘿嘿嘿~#沈梦瑶[超话]# #向全世界安利沈梦瑶# 【YES BOX限时回归——萨摩耶手持镜】 “魔镜魔镜,快告诉我,谁是世
  • 没有到不了的彼岸,没有攀不上的高峰,用心做好此时此刻你该做的就很完美啦!#孟鹤堂[超话]##周九良[超话]##孟鹤堂周九良# 昨晚小孟儿戳心一跪,对观众对前辈对
  • 海底捞:大家都很熟悉的一家火锅,还可以免费做美甲,冲着美甲都想去吃一顿了!本来因为这两天没睡好想买安神茶,结果都有薰衣草,闻着像护肤品似的,作罢。
  • #刘宇宁一念关山# |#刘宇宁宁远舟# | #摩登兄弟[超话]# 刘宇宁你是我的心上人呀啊啊啊啊纯朴与真诚在任何时代总是合时宜的@摩登兄弟刘宇宁 刘宇宁宁远舟[
  • 一个人慢行在山路上,干净的石阶,闻花淡香,听鸟浅语,迎风轻抚……如此让人心净、心静,让人舒服,立冬已过,南方似乎还在立夏,冬阳的光芒四射,却不似夏日骄阳似火,刚
  • ”赤桥小学教师谢祥烨回忆,一位住在蓝山四季小区的老奶奶在初次接到电话时十分紧张,不断询问“这该怎么办、为什么会变成黄码”等问题。有一天,我刚结束上午的采访,又得
  • Q. 最近还在blue square开了演唱会,听说你留了非常多眼泪,那是一种什么样的心情呢?A. 虽然有非常多的瞬间,不过我记忆深刻的是,我是要格外大声地听音
  • 白色蒲公英的花语是永不止息的爱今天是白色蒲公英[哈哈][哈哈]@时代少年团-刘耀文 /、无法停留的爱:蒲公英的种子随风传播,风吹列哪里就会停留夜哪里,即使遇列爱
  • 为此,该研究提出了一种用稀有 token 标识符表示给定主题的方法,并微调了一个预训练的、基于扩散的文本到图像框架,该框架分两步运行;从文本生成低分辨率图像,然
  • 大三女生薇薇决定摆脱母亲独立——但她很快发现,她面临的是与母亲一样的困境:华伦夫人也不是天生下贱,她也是好人家的女儿,只是走投无路。经历过这一切的薇薇,下定决心
  • ”₍˄·͈༝·͈˄*₎◞ ̑̑今天依旧是爱你滴柴~#拾了一只小柴柴[超话]#文科生的浪漫情话U ´꓃ ` U哈喽艾瑞巴蒂,这里是柴,一只秃秃的高三党[doge]