专访吴甘沙:无人驾驶的商业化破局,与驭势科技的从1到10(2)
2017-05-26 编辑:
吴甘沙坦言,从Demo到实际场景的运营,其复杂度、机动性是上了一个台阶的。这就像从原来叶问对着咏春木人桩练习,到与少林18铜人对战,由静入动,在这种情况下,如何判断态势、评估他者(人或动态物体)的动机、预测其行为,并合理获得路权至关重要。
比如,老司机在开车时会根据前方车速快慢决定是否超车、并线,目前,驭势科技使用的是强化学习的方法模仿老司机,在100公里的时速下,可以在前车行驶过慢时进行打灯并线、超车、之后再并线回到原来车道。
但使用大数据驱动深度学习也有命门:即机器很可能会出现训练集中毒、偏差——人举着哑铃的图片作为数据输入,不断训练的结果是,机器会将这段举着哑铃的胳膊也当成哑铃的组成部分。
此外,深度学习最著名的命门,也是至今学术界和研发人员未解决的问题,就是人们并不明白系统是怎么工作的,其原理是一个黑盒子,不具有可解释性。这个选择为什么好、为什么差甚至一定程度上是随机的。
比如,Christian Szegedy等人曾在ICLR2014发表的论文中提出了对抗样本(Adversarial examples)的概念,即在数据集中通过故意添加细微的干扰所形成的输入样本,受干扰之后的输入导致模型以高置信度会得出一个错误的输出。在他们的论文中,他们发现包括卷积神经网络(Convolutional Neural Network, CNN)在内的深度学习模型对于对抗样本都具有极高的脆弱性。
我们人眼可以轻而易举识别出来的图像、物体,假以对抗样本,机器通过深度学习却完全识别不出来。
吴甘沙认为,在开放动态环境下的无人驾驶需要更强壮的AI,要建立这样一种AI,需要深度学习和强化学习两种打法结合。强化学习追求可解释的逻辑推理(理性思考)、强调常识、经验、可以积累的背景知识,同时辅以迁移学习的举一反三、基于贝叶斯的因果推理。
现在在开放道路无人驾驶做得最好的是谷歌Waymo,每5000千英里(合8000多公里)需要一次人类干预,特斯拉每3英里需要一次人类干预,而自动驾驶新秀Uber则每英里需要一次人类干预。但即使是做得最好的Waymo,也不及人类驾驶员的万分之一,人类驾驶员每9000万英里出一次小型事故。
一个很快的解决方案就是使用模拟、仿真,即基于大数据进行快速建模,模拟天气、光照、雨天等,用模拟、仿真+强化学习、以及生成性对抗网络(用于中和上文提到的对抗样本,进行降噪,贴出为真、为假的标签)作无人驾驶中的深度学习。
这几日柯洁在乌镇连连败给AlphaGo,人工智能将不可避免地成为无人驾驶领域的重要探索方向。驭势目前正在与国内外研究机构合作研发驾驶AI,国际著名Tier 1供应商博世也建立了自己的AI孵化器。
无人驾驶AlphaGo比肩人类驾驶员的那一天,或许就在不久后到来。
我是36氪汽车小组负责人卢姿伊,负责特斯拉、无人驾驶、新能源、车联网、出行及后市场,欢迎直接与我联系,微信:17701221940
相关阅读:
相关推荐: