《李白宋121:中文分词歧义及其包容》

分词结果应该长什么样?

最新原创出炉,白老师又有佳作,话题是中文“分词”。

李:请教@白硕 ,“线状补丁”列表的遗漏掉的词汇就是一个 list of words?所说的优先级来自何处?优先级本身是不是也表示出来?根据优先级需要 cut 一刀,否则就是 exhaustive tokenization 的查词典全覆盖了,这一刀在哪里截住有说法吗?

另外: 如果只剩下“难过”一个整体,离合词的寻找就是一个伪命题,更无需说“小河”和作为一个整体的“难过”在语义上是不相谐的。这个说法 逻辑上/语义上 没问题,但从大数据现场看,“小河难过” 的相谐性不是子虚乌有,而是可验证的。只要数据足够大,都可以和谐:1. 过河;2 过小河; 3 难过河; 4 难过小河

白:如果是未经分词的大数据或者未经人工校对的已分词的大数据,你根本不知道那个出现是“难过”还是“难+过”,从而,你也无法给出二者相区别的统计数据。

李:最简单的高频ngrams共现,应该可以确认上面4种相谐。不需要知道 “难过” 是不是 一种 “过”,还是一种 “难”。有意思的是,大数据的语言模型越来越舍弃分词了。gram 都是立足于 characters(字)这种没有争辩空间的基础之上。对分词(错误)完全免疫。换句话说,分词 irrelevant 了。其可行,是因为大数据不怕 redundancy,非逻辑系统也不需要概念单元。甚至欧洲文字明明有空格帮助分词,也有系统开始立足于纯粹的 character(字符,字母和空格等)之上,舍弃“词”的拐杖。最明显的好处就是模型的鲁棒性。错别字 手误 不再是挑战。

最近用机器翻译的时候发现,漏掉几个词,或者某个长词只写了一半,系统照样翻译正确。有时候把几个英文词连在一起写,把空格去掉,也一样出来正确的结果。

白:机器翻译跟精准解析几乎无关。容错也不是元组表示独有的功劳。

李:那是。但是非机器翻译用的模型也都是这个趋向。

是两条路上跑的车,确实不必混在一起谈。

白:我们关注的是,不做“难过”和“难+过”的区分,能走多远?能成为一种常态?如果需要区分,而且是通过“反哺”来区分,那么如何给“反哺”保留最必要的信息?

李:这个问题也琢磨过。

区分可以原子化和词典化,而不是在词典外的系统层面,感觉是相当可行的。就是说,难过 看成是一个单元(词条),两个 senses(概念)。这就对外看上去没有区分,对内转化成了 WSD 的问题。 词典标注的 sense1 就是 sad,sense2 是 “某种” cross。sense2 与动词 “过” 的标注一致。有了词典内部的标注,这个区分就自圆了。

白:这是组合歧义,交叉歧义呢?

难道“文化学+到手”和“文化+学+到手”是同一个“五字词”的两个sense?

李:其实也不是不可以想象的。才 5-gram,总有一天 5-gram 之内的问题 原则上 都可以词典化。起码高频的 5-grams 可以越过传统词界限的束缚。

文化学到手:sense1=“文化学+到手”;sense2=“文化+学+到手”

好处是一旦歧义被“包住”了,敌我矛盾就转化为人民内部矛盾。都是自家人,什么事都好商量。甚至商量不了,解决不了,也可以搁置,不影响外交关系。这个思路感觉是有益的。

以前有个“错误放大”(error propagation)的理论担心。这个理论夸大了局部问题的全局后果。其实如果应对得当,局部问题解决不了,就包住它,也是可以的,影响不到全局。

白:感觉:1)五个不一定够;2)遇到bug现场打包改词典比retrain还不靠谱;3)随着词典的增长,组合歧义/交叉歧义也在增长,这个过程都不一定收敛。4)如果必须牵涉语义,打包过程中语义的组合还是要靠能产性解决而不是靠个案解决,换汤不换药。

你过去做词典的人写词项的定义就ok。现在写多元组的定义,是若干个词项定义的特定形式的组合,在公司里都不见得是同一个工种。等于让修理工当装配工。

李:我的感觉不一样:1)5个够了(99.999..., 就是小数点后到了第几位);2)遇到 bug 现场打包其实是靠谱的,如果只求快速包扎,我们一直就是这样做的;3)收敛是个理论问题,现场的问题是,有没有办法让(高级)用户在现场自己搞定。就是说,系统从来不是一锤子买卖,只要用户自己觉得不是绝路,有逃生的希望,就可以。

白:不可能的。

一个词项乃至N个词项组合对应的标签,客户怎么搞得定

李:预设是精准解析,才会得出不可能、不可持续的结论。但精准解析与分词一样,都是手段,不是目的。从目的和现场看,个案解决或止损,是没有啥问题的。至于要不要统筹解决,那是另一个层面的问题。

白:谈商业是另一种谈法。

李:统筹解决与个案解决是并行的,后台研发不断考虑统筹的问题。前台现场提供个案解决的用户友好工具。个案解决有个回路,反馈到后台,保不准类似的个案问题在下一个 release 中就不必个案解决了。

白:“纽约周三再开放,到中国直飞机票没有,转飞就难说了。”

直飞/机票 vs 直/飞机票

宋:用“大词”就解决了。一般来说,交搭型歧义用大词解决,离合型歧义用词义解决。

李:其实两种歧义都可以大词典应对之,前者是内部解决,后者是内部包容。二者都被“大词”包裹了。包裹的好处是抓大放小,一致对外。甚至连内部发生不可调和矛盾的现象(例如 NP/VP 兼容大词,学习材料/红烧牛肉),也可以包裹得严严实实。如果 “指挥” 可以包裹两个 senses,就没有理由不能让 “学习材料” 包裹两条内部子图路径。

以前提过的一个论点是,NLP 的大部分工作都可以绕开 WSD 来做,说的就是只要能包裹住歧义,绝大多数工作都可以继续,舞照跳,马照跑。

包裹了以后,还解决不解决内部矛盾呢?其实,90%以上的内部矛盾就一直包裹到死,夫妻吵吵闹闹一辈子的有的是,一样过日子。如果恰好在 NLP 应用现场,被包裹的歧义是关键所在。于是会有不到 10% 的内部矛盾,可能需要根据需要重新打开包裹,来解决矛盾。而这种解决也还是词典驱动的。

白:“大词包”的构建绝不可以转嫁给客户,要做,你NLP厂家自己做。这是底线。

李:底线要看商业模式。NLP厂家赋能应用集成商或直接赋能高级用户这种 component technnology 的商业模式,其实没有成功案例(历史上,美国曾经的NLP industry leader Inxight 以自己的 LinguistX 赋能客户,挣扎了10多年,终归于失败)。既然此路迄今不通,那么NLP也就成了应用厂商的内部使用工具和平台。在这样的条件下,NLP厂家和应用集成商合二为一,直接面对客户。这时候,大词包需要根据领域场景和客户的资源去做领域移植,就是顺理成章,不得不做的事情。

大词包一点也不玄妙,用户词典里面充满了大词包。自动领域词典习得得到的结果,多半也是大词包。加载这些大词包资源,是NLP领域应用不可忽略的必要环节,怎么强调也不过分。至于大词包内部如何构建微结构,那自然是个技术活儿,想转嫁用户也转嫁不了。幸运的是,多年实践表明,其实“构建大词包内部微结构”这种事情,在应用现场很多时候是不必要的。如果必要,如何合理分工,增强领域词典的维护和保证数据质量提高的等等问题,有很多另外的办法,难以尽述。

 

【相关】
 
 
 

 

立委兄:别了,小甲

别了,小甲

作者:汉阳一江水

小甲是谁?小甲不是人,小甲也不是宠物,那小甲是个什么东西呢?不错,小甲就是个东西。

小甲是一辆车,一辆米白色轿车,一辆跟随我们十来年,德国大众公司生产的经典款小车----甲壳虫。

Image

当年女儿念大学二年级,刚满十八岁,暑假考取了驾照,我们带她去看车展,她一眼就看中这辆卡通式的小车。在展厅,她眼光始终盯着那台车,挪不动脚步。夫人见此情景,眼眨都没眨,立马掏钱,预订了这款样车,车展一结束,就把这辆车开回了家。

因为这辆车的型号,我们全家就把它宠称为小甲,已区别家里已有的大灰和大白。

Image

女儿非常喜欢这辆小甲,常常变着花样对它进行个性化改造,车外贴着各类卡通动物照,车内摆放各式卡通异型拟人像,整个车就是个卡通世界,引人注目,端是可爱。

虽然刚进大二就买了这辆车,但七年后毕业离校,她一次也没有把车开进校园,同学都不知道她有辆爱车。她仍骑着自行车穿梭在校内校外,购车十一年多,总共才跑三万九千公里,其中一半还是我们贡献的,实在有点对不起这辆小甲。

小甲个头虽小,但很有型。它自重不轻,超过一般轿车,轮胎也宽大,安全感十足。小甲的前排很宽松,操作方便,驾驶平稳,舒适度甚佳。唯一缺陷是动力尚嫌不够,保养维修费相对较高。

Image

我们这款车是经典车型,好多年前就不再生产,是真正的绝版。当听到整个甲壳虫包括新车型也在全球停产后,我们感到十分失落和遗憾,这是一代车时代结束,无奈而又现实。

小甲最大贡献是在疫情期间,那半年武汉成为全国关注中心。

封城期间,在中心医院工作的女儿,全靠小甲,奔波在医院和住家之间。工作,忘我的工作,尽心的工作,连轴的工作,小甲是做出了很大贡献的。当年在空无一人的武汉街道,总有一辆小甲壳虫车,不时的奔驰在空旷的大街上,保证了女儿的工作、休息和饮食,在那个特殊时段里,小甲功不可没。

小甲虽跑的路程不长,但毕竟有十一年时间了,为了安全起见,我们决定置换更新,虽然依依不舍,但思前思后,最终还是决定卖掉小甲,更换新车。

Image

对于卖掉小甲,女儿是不太同意的,毕竟这是一辆她十分钟情的车型,是跟随她十多年的爱车,是伴随她度过青春岁月的坐骑。她对它感情深厚,那毕竟是她青春的记忆,似乎成了她生命的一部分,所以非常留恋,十分不舍。我们非常理解她的心态,为了让她安心,为了有个留念,夫人请了一个摄影大师为她和爱车拍摄了不少倩影美片。同时,为了减轻她的失落,我们保证,新车一定按她喜欢的款型购买。

Image

Image

那天与小甲留影拍照,我们选择长江大桥,晴川阁,铁门关和知音琴台艺术中心这几处为背景,表示知音难舍,武汉生活和古今对比之情怀,为小甲作最后一次道别,缅念已逝去的小甲。

再见了,可爱的小甲。

 

Image

作者简介:

    汉阳一江水,曾用名:立委兄、老顽童。新三届毕业生,科技人士。生活在武汉的安徽人,爱好文学,知识面广而不专,华而不实。善侃吹,号称上懂天文下知地理,实际却是个半瓶子水的庸才俗子而已,惭愧惭愧。

https://mp.weixin.qq.com/s/u9MxOhyoX74kX_kYpJRFnA

 

 

 

 

从疑似愚人节新闻的特斯拉大规模“召回”说起

28万台!特斯拉史上最大规模召回,自动加速成实锤?

谈不上实锤。进入 auto-pilot 的跟车状态,当然会自动加速或减速,否则怎么叫 auto?这事儿以 recall 多少万辆车的这种方式宣传出来,有点诡异(不知道是不是特斯拉中国团队哪位高参出的主意,来忽悠监管?)。估计是特斯拉根据中国国情做的一种妥协姿态?特斯拉软件通过 OTA(Other-the-air)方式定期更新,是大约每两周就一次的,谈不上传统意义的“召回”,没有硬件召回的成本。但它需要摆一个姿态,我召回了,说明我的软件部分在进入 auto 状态方面确实需要/可以完善。所谓改善,大概就是切入自动驾驶的状态更加显性(增加prompt 或给个铃声啥的?)。此前有些新司机进入了自动驾驶而不自知,对于“正常”的自动加速缺乏心理准备,手忙脚乱确实可能出事故。

如果这叫最大规模召回,那么所有软件产品都在不断召回,尤其是微软和苹果的操作系统,动不动就是亿万电脑的召回。我们的手机隔三差五就打个补丁,来次“悉数召回” lol 有点搞笑。

多方调查都说明所谓失控加速是子虚乌有的事儿,可是辟谣远远赶不上造谣的辐射能力。干脆,我全部召回,够意思了吧。这是被逼糊弄客户和小编。打住。这与语义计算无关。但与语义的语用场景倒是的确有干系。这事儿要是在西方,估计不会用这种 recall 多少万辆的宣传口径,来误导/小看普罗的理解力。

果然所谓特斯拉在国内大面积召回,就是在进入自动巡航状态的时候,增加了一个提示音:

Chang uses the video to clarify the difference between TACC and Autopilot. TACC controlled the vehicle’s speed solely and did not have any warning apart from an icon on the central infotainment screen. Activating it demanded just a tap down on the right lever. Autopilot controls the steering and the speed and demands two taps on the same lever.

The Chinese government demanded Tesla to fix the operation of TACC because it could have a higher speed than the one in which the car was going. If the driver tapped down the right lever by accident—such as in a sharp turn—the vehicle could accelerate and lead to a "misjudgment of vehicle control" and crashes.

这是很必要的。我两个月前就跟朋友提起过,进入自动巡航没有任何动静可能是造成用户觉得汽车失控的主因,也在内部提到这个建议,还提到不知道谁能把这个建议反映到特斯拉决策部门。哈 现在的做法实际上采纳了我的建议。
 
我有几次感觉特斯拉失控或者加速的经历
作者: 立委
日期: 2021/04/24 02:52:46

发生在我进入自动跟车状态而不自知的时候。

特斯拉有两种 auto pilot 状态,你按下杆一次,进入“自动跟车/巡 航” 状态,但方向盘还在你自己控制下;你按下两次,才进入 auto-steering 状态,既自动跟车,也自动方向盘。

问题是多数人都是用两下,进入和退出都有明显的提醒声。

有时候第二种状态进入第一种状态的时候因为没有提醒,车主不自知,因为方向盘还在自己手中,以为车还是在自己控制中,这时候就会有失控或加速的错觉。有一次在路口准备右转,发现车继续前行,吓了我一跳。

这是用户接口设计的缺陷:第一种状态的进退,不能没有提醒声,可以改变为一种较轻的或不同的提醒音。这个建议不知道如何有效反馈给特斯拉。

这个问题在老司机中不会出现了,因为摸透了汽车脾性。
这个问题在 FSD 购买者中也基本消失了 因为汽车在第一种状态时候遇到红灯也会停 不会失控闯红灯了。

 
尤其是对于开惯了燃油车的人,按下拉杆以前是向右转,到了特斯拉这里是进入自动巡航。你想想,你本来想当然以为自己是要右转,却进入了直线自动巡航,因为你前面无障碍物,直线自动巡航突然加速,肯定吓了个半死。然后手忙脚乱来纠正,出事故就不奇怪了。
 
加一个铃声很简单,也很必要。前面的问题是问,有人问这样是否足够?需要理解 预期和迁就顾客的老习惯,在操作冲突的时候有一个更好的应对。这就是用户接口设计的问题,与刹车失灵无关。
 
据说国内有5个监管机构,都可以对新型汽车的问题追责。特斯拉正在学会如何应对监管,让身段变得柔软。身段变得柔软的不止特斯拉。最近耐克CEO高调声称 耐克就是为了中国而生(大意)。
 
利之所在,商人自然趋之若鹜。
 
前一阵子耐克被挤压 据说国内李宁牌运动鞋销量猛增了百分之七八百。耐克高调声明后 据说扭转了颓势 形势大好。不知道特斯拉的召回会给销售带来多少利好。
 
特斯拉经受考验,报道说几个媒体为刹车失灵事件中的过分歪曲宣传,同时给特斯拉道歉。刹车不灵维权事件貌似反转,特斯拉反赢一分。但特斯拉的确属于敢于冒险的企业,所以迟早会有新的事件。最终的底气还是产品本身过硬不过硬。特斯拉这方面还是有底气的。

等到两万五千的特斯拉模型2明年量产以后再看吧,那会是挡不住的井喷式爆发。中国消费者不傻。中国消费者不傻的一个表现是,一万美金天价的所谓全自动驾驶(FSD,Full Self-Driving)软件,在美国卖得不错(大约四分之一车主选择购买),但在中国就卖不动(才百分之几)。这是精明的,因为那玩意儿性价比不值得。FSD 以外的自带的 auto-pilot 已经解决了最大的驾驶疲劳问题,FSD 现阶段不过是个炫酷的玩具。

 
另外,特斯拉自动驾驶切身体验最大的一个问题是,大数据中的 corner cases 可能是个体生活中的高频事件,大数据训练的方法无法个性化增强是一个当下的痛点

譬如 我常开的路段中有两处(一处是家门口连续两个红绿灯的地段,确实是个 corner case,连续两个灯是因 为其中一个赶上了救火车站的出口),目前的系统总是“鬼影刹车”(phantom braking),非常 annoying,但是大数据训练每两周更新一次的系统一直解决不了这个问题。可是我没办法个性化教给机器对这两处针对性处置。

统而言之,深度学习和传统机器学习一样,都不能做定点纠错。以前回顾AI两条路线的时候我反复强调过,这是主流AI不如符号AI系统的一个最大痛点之一。纯粹指望数据大了,培训升级,是无法完全解决这样的个性化问题的。

可以想象的解决办法是允许用户做基于地理定位的针对性配置,譬如根据GPS记忆某处的处理方式需要与模型不同。主要是老马压得太紧,很多时候是现在顾不上这些,不是不能实现。例如,高档特斯拉的空气 suspension 系统就可以根据GPS记忆实现用户指定的可调控的高度,增加驾驶舒适度,但 Model 3 和 Y 没有空气悬挂,所以开车很硬,颠簸厉害。

说到特斯拉小三和Y的短板,颠簸绝对算一条。这有个故事。我家特斯拉起名叫 big white (大白)。原来是刚开始买的基本型特斯拉模型3 起名叫 Xiaobai(小白),开了两天觉得颠簸,三天内无条件退换,就去换了辆双马达长续航。其实长得完全一样,尺寸不变,但加了几千块钱,于是叫大白。其实也依然颠簸,开车很硬。好路没感觉,遇到路况不好(加州公路常常失修,路段质量无法恭维),想起来就跟当年学手扶拖拉机驾驶时候的感觉一样。这毛病没治,特斯拉只有豪华版车型 S 和 X 才有空气悬挂,开起来才舒服。但人很奇怪 有心理因素 加了几千块钱 就似乎觉得不那么颠簸了。马斯克本人对此心知肚明,建议顾客不要把轮胎的气放一放,说这样就不会那么硬,瞧,这出的都是什么臭主意:轮胎气不足不仅耗电,降低续航,还有很多其他问题甚至危险。老马曾经一度说要给小三添加空气悬挂,结果回去一合计觉得成本压力太大,自食其言。 

人无完人 车无完车。颠簸是短板 瞬时动力就是亮点 跟跑车似的 飙起来风驰电掣。但其实 这过剩的动力平时也不大用得上 开了一辈子老爷车 Toyota 没有飙车的习惯。宁愿它牺牲一些动力 换取更好的悬挂系统。当然 最大的亮点还是自动驾驶 不仅长途省老力气了 而且好玩得很。不过 据说国内小鹏的自动驾驶不比特斯拉差,在国内路段驾驶感觉比特斯拉好很多。还有华为也紧追上来。

【附转】
 

A Taxonomy of AV Myths
Myth: AV software is a singular “AI” that simply learns to drive over time.
Myth: Creating an AV is just a matter of collecting a large amount of data and putting it into a neural net.
Myth: The company with the most data is necessarily in the lead.
Myth: It’s possible to enumerate every situation an AV will ever encounter. Creating an AV is then just a matter of experiencing each possible situation one time and adding it to the data set.
Myth: An AV can only use its sensors, or its map. It cannot use both at the same time. If the sensor input disagrees with the map, it is an irreconcilable problem and the AV can’t work anymore.
Myth: Mapping is extremely expensive (billions of dollars) and/or time-consuming (years).
Myth: If an AV uses a map, then it cannot handle construction zones or other changes.
Myth: If an AV uses a map, then it cannot ever operate in unmapped areas.
Myth: If an AV uses a map, then it’s just a tram running on virtual rails.
Myth: Roads are designed for vision, so other sensor modalities like lidar and radar are useless.
Myth: Lidar uses a huge amount of power.
Myth: Lidar is so power-hungry that it can’t be used on a battery electric vehicle.
Myth: Computer vision is as good as lidar, so lidar is useless.
Myth: Humans drive just fine with two eyeballs, so other sensor modalities (radar and lidar) are useless.
Myth: Once your AV sort of works for a few miles at a time, it’s an easy process to improve it to superhuman reliability. It’s just the March of Nines, which requires nothing but time, or more data.
Myth: If an AV completes a trip without an intervention or disengagement, then it was L4 (or L5) for that trip.
Myth: It is possible for individuals to observe an AV system over the course of their typical personal driving needs and declare the system universally safe.
Myth: The trolley problem is of fundamental importance to the design of AVs.
Myth: AVs can’t work unless we put sensors or beacons in all the roads, and/or make all the cars talk to each other wirelessly.
Myth: Simulations are useless.
Myth: It’s all just a matter of finishing the software.
Myth: Regulations are the only thing holding back AVs.
Myth: Humans have to be sacrificed today in order for an AV system to improve, so it will eventually save lives.
Myth: This is a taxonomy, and not just a litany.
 
【相关】
 
 
 

与AI老友再谈特斯拉自动驾驶

AI老友再谈特斯拉自动驾驶

 

特斯拉推超级计算机Dojo:用世界第一算力终结无人驾驶战争?

https://mp.weixin.qq.com/s/F6Noe325OiNBwjei2SzwWg

Wei:终结谈不上。特斯拉目前只是把一件事先做到极端,一条腿走路,死磕的话,跛子也可以参加奥林匹克得奖,就跟断了手用双脚弹琴也可以弹出美妙的音乐的(听过用脚弹的琴,可听不可看,一样美得心颤。不可看是因为看了让人心酸,如果恰好是忧伤的音乐还好,否则的话,会影响扰乱欣赏音乐的本真情绪。)

目前中美(中国有华为,美国有weimo,中美还有一批初创,网上有视频展示)都有一批用激光雷达 + prescan 高清地图 + 视觉的融合/后备的主流办法来做繁忙复杂交通上的自动驾驶,其水平比特斯拉高出太多了。特斯拉排除各种雷达纯粹视觉,用单一超大数据的路线根本就不可能达到那样的高度。最终的终结方案(如果有终结的话),不可能是特斯拉目前坚持的AI单一路线。不出五年,特斯拉马斯克如果正常的话,就会去拥抱激光雷达,而不是现在这样断言“激光雷达是自动驾驶的死路”,“激光雷达白给我我也不要”。

特斯拉一家抵抗一个世界,唯一貌似站得住的 argument 是说包含了激光雷达和高清地图的路线难以 scale up,但是它忘了,所有的其他厂家的自动驾驶系统都是真正的 hybrid AI,并不是只靠激光雷达和高清地图,他们一样用计算机视觉 CV。不能 scale up 的指责,在激光雷达太过昂贵难以量产普及的时候,还有些道理。现在,这种指责根本就站不住。混合系统在有高清的时候用高清(譬如大中城市 繁忙路段 downtowns),在没有高清的时候 backoff 到 CV,这怎么不可行 怎么就不能 scale up 呢?

 
guo:还真不是。这就像我们常说的深度学习与知识系统“并举”。反正终结围棋的是个纯粹的极端。

wei:嗯,这算是一个正例。围棋这种 game 与自驾的应用不好比 不一定是 apples to apples
视觉本质上是局限性很强的。特斯拉最常用的 argument 说人就是靠视觉驾驶 道路交通及其信号系统也主要是根据人的视觉来设计的。这个 argument 太弱 门槛设的太低,因为人的驾驶实在无法恭维,不应该是自动驾驶的标杆:每年太多交通事故了,一直高居人类杀手前三。绝对不是我们的理想目标。最多能做基线。

guo:看看特斯拉对拿掉 雷达 的解释吧。马斯克的提问:两者矛盾了听谁的?

wei:这正是我要 address 的:一个新近的 argument 是说 信息融合不好做 马斯克问:如果雷达和视觉产生矛盾 听谁的?这个 argument 不无道理,但已经退到了算法的水平之争了。Hybrid AI 当中的 information fusion 一直都有各种挑战,也一直都有不断进步。这个argument 不是致命的,因为 融合 有各种算法,除了紧耦合外,还可以松耦合,可以架构为 backoff,特斯拉没有办法对主流自动驾驶一剑锁喉。我的预测,最终不是自驾主流去迁就特斯拉,而是特斯拉拥抱和回归主流。其中,已经越来越平价化的激光雷达会是自动驾驶之重器:产业界对此市场的布局已经开始,中美都会有以激光雷达为核心业务的独角兽崛起。

 
mai:伟哥铁嘴钢牙,直断自驾乾坤。
 

guo:不同意。为什么不能是另一条路:改变环境?今天的道路就是环境与汽车共同进化的结果。激光雷达不上不下。鸡肋了。

wei:改变环境也是综合治理的一个途径 也许是必由之路。但根子还是视觉的局限性。不同感官器 有 overlapping 但更有相互弥补的一面。激光雷达对于至关重要的障碍物的距离和景深的测量精度,对于视觉是压倒性的,何况视觉受到光线、天气和其他因素干扰的可能性大太多了。特斯拉 cv only 是直接无视雷达互补的一面。

guo:再想想下围棋。谷歌也是直接无视了整个人类上下五千年

wei:围棋的类比有两个短板 一个是场景的纯粹性 围棋毕竟是game 另一个是围棋不依赖硬件的互补性。

由于自驾对于安全性的无止境追求 因此 只依赖视觉不可能是最佳路线。

guo:这也是个误区:没人要“无止境”。特斯拉自己讲的:八百万里错一次。

wei:无止境作为方向 没错。

飞机比其他工具安全性高太多了。但没人说航空不需要进一步追求安全。每次空难都是一次人类神经的折磨。

当然,真达到全场景八百万里错一次,也的确比起人类驾驶强太多了。这意味着人要活好几辈子才可能出一次事故。而人类驾驶,谁没经历过惊心动魄死里逃生的驾驶噩梦?我们还都是幸存者,还有为数不少的不幸者根本就没有机会发声。我自己就一直是个非常不自信的司机,这么多年下来,多次有惊无险,我老觉得在某些平行宇宙早已经死过多回了。因此我对自动驾驶,哪怕是不够成熟的自动驾驶,都特别有拥抱救星的冲动,感觉总比我这种凡人强多了,而且只会越来越强。

自从有了特斯拉,我一辈子也没有过这么省心、自信和乐趣的驾驶体验。感觉是已经生活在未来。特斯拉是真正把自动驾驶量产交付给普罗客户手中的先驱,为此我们感谢马斯克,忍耐他的大嘴巴。

guo:马斯克到NASA去批评NASA:你们不能创新,根本的原因,不是没钱没人没技术,是对“万无一失”的追求限制了你们。马斯克炸火箭就是家常便饭。他的口头禅就是:你不炸就是保守了。

wei:冒进主义。马斯克半年前说 feature complete vision only FSD 两周内发布,这都过去半年了 还在难产。

guo:FSD不会很快突破。光这个雷达就还没搞定呢。就是高呼特斯拉股票四千刀的 木头姐 也只是认为 理想情况2023年。

wei:马斯克太急躁,不像是深耕过软件产品的人。也许更多是性格和理念使然。
vision only FSD 之前,那个版本虽然有短板和瓶颈,但确实是不断迭代 令人印象深刻。他于是着急做宣传:gigantic improvement,FSD 马上就可以普及了 宣布很快给个 FSD button 大家下载使用 帮助“众筹”提升质量。我们听到都急不可待企盼。

可话音刚落,他突然做出 vision only 的决定:立马生产不带有雷达的车辆。这就把自己和团队逼到一个死角。软件的迭代更新 做如此重大的底层变更 怎么可能期望短期内把窟窿都堵上?但他还是不断发推,一会儿 next two weeks,一会说 definitely in May,一会儿又说 hopefully June,据说七月大概可以在内部的 beta testors 中开始试行第一版 vision only。马斯克大嘴 与马斯克时间 一样甚至在粉丝群里面也都成为笑柄。可怜在他手下干活的那些人,被这种老板不切实际的计划催逼。

话说回来,他这样来也许还真是提升了生产率。达不到计划没关系,反正现在没人拿马斯克的时间表当回事。但这种高调计划带来的压力,只要不被压垮,就会激发潜力。

guo:人跟人不一样。马斯克现在最倚重的那位斯坦福博士就感受到了不断挑战不断突破的快感。

wei:我听了他最近的演讲 他是很 high,整体上还是在拼算力 是核武器竞赛的快感。说是明年的算力可以达到世界第一。很多人看不上这种蛮力 觉得没有真正意义上的突破。

 
 
 
Wei:更重要的优势是数据。真正的超大数据和超大训练。
 
Tang:AI = Algorithm + Architecture + Data,中文叫“算力”, 这里可以认为就是搭建集群的Architecture. 例如:谷歌用自己的TPU。
 
Wei:特斯拉自驾的真正对手最有可能是华为。也许还有苹果 其次才是谷歌weimo。但特斯拉有造车的炼狱式洗礼 这是硬门槛 其他各家这方面一时难以赶上。
 
Tang:Tesla的对手是这些有革命性的小公司(https://www.aptera.us/)。一旦Solar power的车真能成功,EV就会变为辅助了。
 
Yan:Tesla和其他智能汽车的真正对手是智能公路。智能驾车的瓶颈,不是智能,是信息的采集,而信息采集在公路平台上才能最好解决。智能决策也只有在公路平台上才能最好实现。想一下智能汽车的难点,换到公路上,大多不难了。现在国内的公路已经在大踏步的向智能化迈进了。今后都市的交通就是私有(私控的)小车交由公共的智能交通来开。小车自身不需要什么智能,就是一部有轮子、有座位的手机而已。
 
Wei:这方面中国具有天然后发优势,也有决策快 拥抱新事物的优势。美国上下的惰性太大,决策太慢太难,没法与中国比。
 
Gong:有了智能公路,汽车就是高铁,车子本身能开能停就行了。
 
Tang:不太认同智能公路的概念。 目前Edge computing还做不到250ms就能做出自动驾驶需要的反应。
 
【相关】