有些人想知道现在,自动驾驶模型已经学会了描述驾驶技能。和轿车解说的题,但是又不知道真假,小编为你详细的解说吧!
作者李凡
原文链接
NVIDIAAI科学家“我们最近所做的最令人兴奋的研究”
“我前面的车也停了,停了。”
“前面的路已经畅通了,所以我们要加快速度。”
你还记得三堂课前解释驾驶动作时被驾校教练支配的恐惧吗?
事实上,前两句话都来自AI,是自动驾驶模型LINGO-1在驾驶时生成的。LINGO-1通过将自然语言引入自动驾驶模型来提高模型的可解释性。
开发团队来自英国创业公司Wayve,创始人获得剑桥大学机器学习博士学位,今年3月,比尔盖茨试驾了Wave的自动驾驶汽车。
那么LINGO-1到底能做什么呢?有什么好处?
LINGO-1可以做什么
LINGO-1主要可以实现两个功能行车解说和可视化。
第一个是驾驶评论。LINGO-1使用语言来描述驾驶行为并解释控制车辆时的决策。
例如,在上图中,当LINGO-1尝试驾驶车辆超越停在路边的车辆时,会输出以下文本
由于交通拥堵,我们走得很慢。
超越一辆停放的汽车
加速前进,因为前方的道路是光明的
除了车辆等大型障碍物外,它还可以识别斑马线等地面标志。
可以看到图中继续提供了说明。
道路仍然开放,因此请保持稳定的步伐
减速、刹车并停在人行横道前
出发后,道路畅通,加速度很大。
在十字路口复杂的场景中我无法停止说话。
前面的车停了又停。
如果您加速并遇到十字路口,请踩刹车。
车道再次开放。沿着小路走,然后左转。
还有功能,你可以向驾校教练询各种驾驶场景的题,仿佛在评价模型的场景理解和推理能力。
我们可以询LINGO-1模型在这个路口关注什么,如下所示。LINGO-1说当他看到红灯时他停了下来。
当被及停车时最关注的三件事时,模特解释说,她最关注的是红绿灯、停在前面的自行车和过马路的行人。
还要询天气如何影响驾驶。
可以看到LINGO-1可以识别雨天,并说因为有小雨,所以会更加小心驾驶。
他承认,“我无法预测雨什么时候会停。”
通过演示,相信大家已经了解了LINGO-1与其他自动驾驶车型——的最大区别。
LINGO-1将会解释。
LINGO-1的文本输出与常规聊天机器人不同。他们都解释了“为什么我在这种情况下完成这个驾驶任务。”
有题也有案,但都是建立在了解驾驶情况的基础上的。
Wayve将其称为LINGO-1VLAM,其最大的创新是将自然语言引入自动驾驶。
近日,在FSDV12的直播中,马斯克接管了车辆,因为他在过路口时无法准确识别车辆,路灯显示可以左转,但车辆开始直行。
马斯克后来表示,解决这个题的方法是返回并“提供更多左转灯视频数据”。
LINGO-1的训练过程中也有“视频数据”,但也有很多来自经验丰富的驾驶员的“语音数据包”。
Wayve在训练LINGO-1模型时邀请了很多专业司机,其中一些是驾校教练,Wayve要求他们大声说话并解释为什么他们在驾驶测试车辆时会这样做。
乍一看,这是大家都熟悉的场景。
随着LINGO-1的出现,自动驾驶的逻辑从“感知->驾驶行动”转变为“感知->文本推理->驾驶行动”。
这样做有什么好处呢?
有什么好处?
主要有两个方面提高模型的可解释性和加速模型本身的改进。
首先,最大的好处是提高了模型的可解释性。
自动驾驶是一种基于神经网络的程序,而神经网络长期以来一直是一个“黑匣子”。这意味着人们知道神经网络可以做什么,并且他们已经能够调整参数来提高神经网络的效率和准确性。
No Comment