与AI老友再谈特斯拉自动驾驶

AI老友再谈特斯拉自动驾驶

 

特斯拉推超级计算机Dojo:用世界第一算力终结无人驾驶战争?

https://mp.weixin.qq.com/s/F6Noe325OiNBwjei2SzwWg

Wei:终结谈不上。特斯拉目前只是把一件事先做到极端,一条腿走路,死磕的话,跛子也可以参加奥林匹克得奖,就跟断了手用双脚弹琴也可以弹出美妙的音乐的(听过用脚弹的琴,可听不可看,一样美得心颤。不可看是因为看了让人心酸,如果恰好是忧伤的音乐还好,否则的话,会影响扰乱欣赏音乐的本真情绪。)

目前中美(中国有华为,美国有weimo,中美还有一批初创,网上有视频展示)都有一批用激光雷达 + prescan 高清地图 + 视觉的融合/后备的主流办法来做繁忙复杂交通上的自动驾驶,其水平比特斯拉高出太多了。特斯拉排除各种雷达纯粹视觉,用单一超大数据的路线根本就不可能达到那样的高度。最终的终结方案(如果有终结的话),不可能是特斯拉目前坚持的AI单一路线。不出五年,特斯拉马斯克如果正常的话,就会去拥抱激光雷达,而不是现在这样断言“激光雷达是自动驾驶的死路”,“激光雷达白给我我也不要”。

特斯拉一家抵抗一个世界,唯一貌似站得住的 argument 是说包含了激光雷达和高清地图的路线难以 scale up,但是它忘了,所有的其他厂家的自动驾驶系统都是真正的 hybrid AI,并不是只靠激光雷达和高清地图,他们一样用计算机视觉 CV。不能 scale up 的指责,在激光雷达太过昂贵难以量产普及的时候,还有些道理。现在,这种指责根本就站不住。混合系统在有高清的时候用高清(譬如大中城市 繁忙路段 downtowns),在没有高清的时候 backoff 到 CV,这怎么不可行 怎么就不能 scale up 呢?

 
guo:还真不是。这就像我们常说的深度学习与知识系统“并举”。反正终结围棋的是个纯粹的极端。

wei:嗯,这算是一个正例。围棋这种 game 与自驾的应用不好比 不一定是 apples to apples
视觉本质上是局限性很强的。特斯拉最常用的 argument 说人就是靠视觉驾驶 道路交通及其信号系统也主要是根据人的视觉来设计的。这个 argument 太弱 门槛设的太低,因为人的驾驶实在无法恭维,不应该是自动驾驶的标杆:每年太多交通事故了,一直高居人类杀手前三。绝对不是我们的理想目标。最多能做基线。

guo:看看特斯拉对拿掉 雷达 的解释吧。马斯克的提问:两者矛盾了听谁的?

wei:这正是我要 address 的:一个新近的 argument 是说 信息融合不好做 马斯克问:如果雷达和视觉产生矛盾 听谁的?这个 argument 不无道理,但已经退到了算法的水平之争了。Hybrid AI 当中的 information fusion 一直都有各种挑战,也一直都有不断进步。这个argument 不是致命的,因为 融合 有各种算法,除了紧耦合外,还可以松耦合,可以架构为 backoff,特斯拉没有办法对主流自动驾驶一剑锁喉。我的预测,最终不是自驾主流去迁就特斯拉,而是特斯拉拥抱和回归主流。其中,已经越来越平价化的激光雷达会是自动驾驶之重器:产业界对此市场的布局已经开始,中美都会有以激光雷达为核心业务的独角兽崛起。

 
mai:伟哥铁嘴钢牙,直断自驾乾坤。
 

guo:不同意。为什么不能是另一条路:改变环境?今天的道路就是环境与汽车共同进化的结果。激光雷达不上不下。鸡肋了。

wei:改变环境也是综合治理的一个途径 也许是必由之路。但根子还是视觉的局限性。不同感官器 有 overlapping 但更有相互弥补的一面。激光雷达对于至关重要的障碍物的距离和景深的测量精度,对于视觉是压倒性的,何况视觉受到光线、天气和其他因素干扰的可能性大太多了。特斯拉 cv only 是直接无视雷达互补的一面。

guo:再想想下围棋。谷歌也是直接无视了整个人类上下五千年

wei:围棋的类比有两个短板 一个是场景的纯粹性 围棋毕竟是game 另一个是围棋不依赖硬件的互补性。

由于自驾对于安全性的无止境追求 因此 只依赖视觉不可能是最佳路线。

guo:这也是个误区:没人要“无止境”。特斯拉自己讲的:八百万里错一次。

wei:无止境作为方向 没错。

飞机比其他工具安全性高太多了。但没人说航空不需要进一步追求安全。每次空难都是一次人类神经的折磨。

当然,真达到全场景八百万里错一次,也的确比起人类驾驶强太多了。这意味着人要活好几辈子才可能出一次事故。而人类驾驶,谁没经历过惊心动魄死里逃生的驾驶噩梦?我们还都是幸存者,还有为数不少的不幸者根本就没有机会发声。我自己就一直是个非常不自信的司机,这么多年下来,多次有惊无险,我老觉得在某些平行宇宙早已经死过多回了。因此我对自动驾驶,哪怕是不够成熟的自动驾驶,都特别有拥抱救星的冲动,感觉总比我这种凡人强多了,而且只会越来越强。

自从有了特斯拉,我一辈子也没有过这么省心、自信和乐趣的驾驶体验。感觉是已经生活在未来。特斯拉是真正把自动驾驶量产交付给普罗客户手中的先驱,为此我们感谢马斯克,忍耐他的大嘴巴。

guo:马斯克到NASA去批评NASA:你们不能创新,根本的原因,不是没钱没人没技术,是对“万无一失”的追求限制了你们。马斯克炸火箭就是家常便饭。他的口头禅就是:你不炸就是保守了。

wei:冒进主义。马斯克半年前说 feature complete vision only FSD 两周内发布,这都过去半年了 还在难产。

guo:FSD不会很快突破。光这个雷达就还没搞定呢。就是高呼特斯拉股票四千刀的 木头姐 也只是认为 理想情况2023年。

wei:马斯克太急躁,不像是深耕过软件产品的人。也许更多是性格和理念使然。
vision only FSD 之前,那个版本虽然有短板和瓶颈,但确实是不断迭代 令人印象深刻。他于是着急做宣传:gigantic improvement,FSD 马上就可以普及了 宣布很快给个 FSD button 大家下载使用 帮助“众筹”提升质量。我们听到都急不可待企盼。

可话音刚落,他突然做出 vision only 的决定:立马生产不带有雷达的车辆。这就把自己和团队逼到一个死角。软件的迭代更新 做如此重大的底层变更 怎么可能期望短期内把窟窿都堵上?但他还是不断发推,一会儿 next two weeks,一会说 definitely in May,一会儿又说 hopefully June,据说七月大概可以在内部的 beta testors 中开始试行第一版 vision only。马斯克大嘴 与马斯克时间 一样甚至在粉丝群里面也都成为笑柄。可怜在他手下干活的那些人,被这种老板不切实际的计划催逼。

话说回来,他这样来也许还真是提升了生产率。达不到计划没关系,反正现在没人拿马斯克的时间表当回事。但这种高调计划带来的压力,只要不被压垮,就会激发潜力。

guo:人跟人不一样。马斯克现在最倚重的那位斯坦福博士就感受到了不断挑战不断突破的快感。

wei:我听了他最近的演讲 他是很 high,整体上还是在拼算力 是核武器竞赛的快感。说是明年的算力可以达到世界第一。很多人看不上这种蛮力 觉得没有真正意义上的突破。

 
 
 
Wei:更重要的优势是数据。真正的超大数据和超大训练。
 
Tang:AI = Algorithm + Architecture + Data,中文叫“算力”, 这里可以认为就是搭建集群的Architecture. 例如:谷歌用自己的TPU。
 
Wei:特斯拉自驾的真正对手最有可能是华为。也许还有苹果 其次才是谷歌weimo。但特斯拉有造车的炼狱式洗礼 这是硬门槛 其他各家这方面一时难以赶上。
 
Tang:Tesla的对手是这些有革命性的小公司(https://www.aptera.us/)。一旦Solar power的车真能成功,EV就会变为辅助了。
 
Yan:Tesla和其他智能汽车的真正对手是智能公路。智能驾车的瓶颈,不是智能,是信息的采集,而信息采集在公路平台上才能最好解决。智能决策也只有在公路平台上才能最好实现。想一下智能汽车的难点,换到公路上,大多不难了。现在国内的公路已经在大踏步的向智能化迈进了。今后都市的交通就是私有(私控的)小车交由公共的智能交通来开。小车自身不需要什么智能,就是一部有轮子、有座位的手机而已。
 
Wei:这方面中国具有天然后发优势,也有决策快 拥抱新事物的优势。美国上下的惰性太大,决策太慢太难,没法与中国比。
 
Gong:有了智能公路,汽车就是高铁,车子本身能开能停就行了。
 
Tang:不太认同智能公路的概念。 目前Edge computing还做不到250ms就能做出自动驾驶需要的反应。
 
【相关】
 

发布者

立委

立委博士,出门问问大模型团队前工程副总裁,聚焦大模型及其AIGC应用。Netbase前首席科学家10年,期间指挥研发了18种语言的理解和应用系统,鲁棒、线速,scale up to 社会媒体大数据,语义落地到舆情挖掘产品,成为美国NLP工业落地的领跑者。Cymfony前研发副总八年,曾荣获第一届问答系统第一名(TREC-8 QA Track),并赢得17个小企业创新研究的信息抽取项目(PI for 17 SBIRs)。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据