谁在抄特斯拉后路
AIDay大杀四方之后,势头颇猛的特斯拉又对自己“砍”了一刀。
近日,特斯拉宣布,不再在自动驾驶传感器套件中使用超声波传感器(USS),将采用纯摄像头的“TeslaVision”系统。对于此次“割肉”,业内免不了又是一番讨论,但在争议之余,未免没有几分眼热。
当下,智能汽车品牌普遍已经把高速公路场景下的辅助驾驶收入囊中,赛场已经逐渐转换到城市场景,在此基础上,技术路线被分为三种流派:纯视觉;重地图、轻感知;重感知、轻地图。
年7月,走纯视觉路线的特斯拉推送FSDBetaV9.0,新增城市道路NOA,成为全球首家实现城区NOA的车企。如今特斯拉更是去掉超声波雷达,无疑把差距进一步拉大。
回到后两种路线上,近期,由于高精地图监管收严,可以观察到,更多自动驾驶公司正在探索“重感知、轻地图”路线,甚至还出现了争抢路线首名的情况。
某种程度上,特斯拉也属于“重感知、轻地图”的范畴,前者同样不采用高精地图,只不过在感知层面较为纯粹,而在共性的算法层面,靠齐特斯拉不失为一条捷径。倘若从这个角度来看,特斯拉的“牙慧”,会成为L2进城的解药吗?
高精地图,“拐杖”被抛弃
做个简单的统计,近期许诺向市场推送城市领航辅助驾驶功能的车企至少有三家:
8月26日,成都车展上,长城魏牌表示城市NOH智能辅助驾驶将率先在摩卡DHT-PHEV激光雷达版搭载,年9月量产,年内发售。
9月17日,小鹏汽车官方微博表示向部分广州车主推送城市NGP功能;9月23日,极狐与华为合作的阿尔法SHI(HuaweiInside)版在深圳推送城区NCA功能。
当下,高速公路场景下的辅助驾驶已经不是新鲜事,或多或少,车企需要新的产品来“镇场子”,而城市领航辅助驾驶功能,就是被争抢的香饽饽。
按照惯例,此前高速场景离不开的高精地图,如今想“进城”,配套的高精地图更是必不可少。
根据《智能网联汽车高精地图白皮书》,高精地图所蕴含的信息丰富,含有道路类型、曲率、车道线位置等道路信息,以及路边基础设施、障碍物、交通标志等环境对象信息,同时包括交通流量、红绿灯状态信息等实时动态信息。
(高精度导航地图将复杂环境规则化)
业内普遍认为,城市领航的体验度十分依赖城市高精地图,甚至有一种说法,高精地图是智能驾驶的两根拐杖之一。拿极狐来说,其依靠合作方华为获得高精度地图支持。
如今,高精地图这根拐杖颇有些不牢靠。
受限于成本考量:首先,高精地图的数据很看重覆盖度,但全国的城市道路可不是一个小的工作量;其次,还需要解决鲜度问题。目前绝大多数自动驾驶系统对高精度地图的鲜度和品质都有很高的要求,但图商们在鲜度上并未能让车企满意。更致命的资质问题不必多说。
在此基础上,为了抢占“进城”风口期,“重感知,轻地图”路线被更多车企注意。
典型的是毫末智行,其城市NOH系统包含了2颗线激光雷达,5颗毫米波雷达,12颗超声波雷达,4颗环视摄像头,4颗侧视摄像头,4颗万像素感知摄像头,以此来摆脱高精地图的限制。
就连之前“重地图,轻感知”的路线小鹏也在开始转舵。拿刚上市的小鹏G9来说,其Max车型标配XNGP智能辅助驾驶系统,“XNGP系统重感知且不依赖高精度地图,无论有图无图,都可以运行。”
根据以一己之力改变小鹏策略的博主
blood旌旗披露,“小鹏大约会在23年下半年-24上半年,实现「轻地图、重感知」的城区高阶辅助驾驶。而且确认:感知系统以视觉为主,激光雷达用来避障。”实际上,早在今年七月对何小鹏的一期专访里,被问及高精地图海外资质的问题,何小鹏间接回应了路线方向,“随着时间的过去,我们很快在没有高精地图的车上,我们也全兼容。”
除此之外,轻地图路线还混进来一个“野蛮人”:大疆车载。媒体口径下,上汽通用五菱与大疆的首款合作车型——款KiWiEV,只用一套“1前视双目+4环视鱼眼+1前向毫米波雷达+12超声波雷达”的硬件组合,就能实现城市道路场景的驾驶辅助。
总的来说,在技术路线选择上,高精地图这根“拐杖”似乎要被抛弃掉了。
L2进城,还得靠齐特斯拉?
尽管大家都在媒体层面都在抛弃高精地图,但失去这根“拐杖”后,想要走好“重感知”路线并不是那么轻松的,硬件层面的缺失自然需要智能算法层面的补位才行。
作为自动驾驶技术体系之一,算法的有效性影响自动驾驶的每一个环节,从感知环节的特征提取到神经网络的决策,都需要依赖算法改进来提高障碍物检测准确性和复杂场景下的决策能力。
目前,以Transformer为代表的大模型是自动驾驶算法的重要发展方向。
Transformer最早由谷歌在年提出,首先被应用在自然语言处理领域(NLP),用来处理序列文本数据。在自然语言处理领域取得广泛应用后,Transformer也被成功移植到计算机视觉(CV)领域。
注意到Transformer的神奇之处,特斯拉率先拿去在自动驾驶行业应用。年特斯拉的AIDay上,自动驾驶技术负责人AndrejKarpathy公开了FSD自动驾驶系统中采用的算法,而Transformer正是其中最核心的模块之一。
(特斯拉利用Transformer实现多摄像头数据融合)
根据中金《人工智能十年展望(三):AI视角下的自动驾驶行业全解析》披露:特斯拉从安装在汽车周围的八个摄像头的视频中用传统的ResNet提取图像特征,并使用Transformer、CNN、3D卷积中的一种或者多种组合完成跨时间的图像融合,实现基于2D图像形成具有3D信息输出。
由于Transformer可以很好地在空间-时序维度上进行建模,且在多模态融合方面具备较大优势,国内也有厂商将Transformer引入自动驾驶系统中,比如毫末智行。
和特斯拉纯视觉方案不一样的是,毫末智行是视觉+激光雷达方案。根据毫末智行最新一期AIDAY上表述,依托长城汽车的量产能力,毫末智行积累了海量的行驶数据,并且通过其数据智能体系MANA与基于Transformer的超大型神经网络进行有机地结合。
其中在Transformer应用上,简单来说,毫末智行基于Transformer的感知算法应用到实际的道路感知问题,如车道线检测、障碍物检测、可行驶区域分割、红绿灯检测识别、道路交通标志检测、点云检测分割等。
基于毫末智行和特斯拉的技术共性,可以得出结论,随着前方道路逐渐清晰,车企的技术路线正在走向趋同。
不过随着路线趋于明朗,行业也出现了迥异一幕。
在今年8月7日的媒体发布会上,智行者发布高速领航系统H-INP,按照智行者的说法,这是“国内首家不依赖高精地图的高级别自动驾驶解决方案”。
在具体技术路径上,智行者设计了一套重感知的智能驾驶算法架构,关键点包括:重感知,轻地图、基于BEV多传感器时空融合感知框架、基于Transformer的多传感器特征和多视角特征融合机制。
有业内人士对此戏谑道,“特斯拉:要不你们直接播放我们AIDay的发布会视频得了。”
回到Transformer上,虽然特斯拉不是造轮子的那个,但的确是第一个拿来解决自动驾驶问题的。在商言商,在技术路线上合流本无可厚非,但缺乏个性照搬确实难以挽尊。
(OccupancyNetwork算法演示)
可以看到,就在近日的AIDay,特斯拉又搞出了些新活,例如去年的关键词还是BEV、Transfomer和Hydranet,今年摇身一变为OccupancyNetwork、LaneObjects,技术迭代能力惊人。
那么对于拾特斯拉“牙慧”的厂商而言,新的问题就出现了,正如知乎用户RobotDreamer发出的疑问:
“国内大部分自动驾驶公司的BEV方案目前尚未工程化,Tesla跳跃式的转入occupancynetwork+NERF给国内同行出了大难题,究竟跟还是不跟?尤其一些正在做BEVTransformer的同学会比较纠结了。”(ps:以上结论基于其他车企相关的分享过于有限)
写在最后
近期,众多厂商纷纷在国内开放了部分城市的领航辅助驾驶功能作为试点。
拿小鹏和极狐来说,《九章智驾》猜测两家均是先采用极其极其极其极其个别的友好用户(每家普通消费者数目得到体验入场券的人不会超过小几十个人,基本上选中了就可以回家买彩票了)优先体验的方式打开城区导航智能驾驶。
至于蔚来、理想等厂商,均未见量产产品踪影。
各家在释放城区导航驾驶上非常谨慎可以理解,毕竟从高速到城市的自动驾驶难度系数显著增长——半封闭、道路结构化的高速场景复杂度较低,更易于智能驾驶功能量产落地,而城市路况复杂度高,行人、车辆等道路因素较多,更易出现Cornercase。
此外,在现实出行层面,对于量产车而言,坐在驾驶位上的是普通消费者,而不是“久经考验”的智能驾驶公司的Test-Driver们,消费者对于系统表现的预见性与车辆操控的熟练度远远比不上后者。
根据中金测算,目前受制于相关政策不健全、技术落地难等问题,适配城区的高阶驾驶辅助功能渗透率不高,随着激光雷达硬件装配率提升,-年期间,国内城市领航辅助前装市场规模有望从8亿元,提升至.5亿元,期间CAGR达96.9%。
对此,希望车企
转载请注明:http://www.abuoumao.com/hyls/3216.html