极客汽车

极客汽车

关注

在新摩尔定律下,地平线征程 5「突破了自我」

环形隧道
地平线
芯片

2022-07-15

作者:双涡轮增压的小胖子

如今,随着汽车智能化的发展,无论是国际芯片巨头还是国内 AI 芯片公司,越来越多的人开始在车规级 AI 芯片上发力,而地平线就是其中之一。

地平线征程 5 芯片在 2021 年 7 月正式发布,是继征程 2 和征程 3 之后,地平线推出的第三代车规级自动驾驶芯片。一年之后的今天,地平线征程 5 这块芯片没有改变硬件架构和算法,却大幅提升了计算性能。

它是如何做到的?如今的地平线征程 5 又能否代表国产车规级 AI 芯片,在市场中打出一方天地呢?

征程 5 的征程路

征程 5 这块芯片无论是对地平线公司本身还是国内车规级芯片领域都有着非常重要的意义。既代表着国内大算力车规级 AI 芯片从 0 到 1 的转变,也为与国际大厂们相竞争做好了准备。

长久以来,像英特尔、英伟达、AMD 等传统芯片巨头们,在 CPU GPU 上存在着很强的优势,并且他们都将 AI 看做重要的战略发展方向。

但地平线认为目前 CPU、GPU 等通用处理器远远不能满足如今的计算需求,通过软硬联合设计、协同优化计算架构,对于提升芯片真实效能有重要作用。所以,地平线始终坚持「应用场景驱动软件创新,继而从软件创新驱动定义新一代计算架构」。

于是,地平线自主研发了可编程 AI 加速引擎 BPU。

BPU 全称为 Brain Processing Unit,是一款典型的异构多指令多数据的系统,主要是用来支撑深度神经网络,相比 CPU 更高效。核心技术理念是「首重效能,兼顾灵活」,保证 AI 芯片能够快速适应最新主流算法,同时预留足够的开放可编程性。

而贝叶斯是地平线推出的第三代 IP 计算架构,具备高性能、低能耗、低延迟的特点,专为高等级自动驾驶应用打造。贝叶斯 BPU 将 BPU 设计与现代神经网络协同优化,支持不同道路场景下的 AI 算子;同时利用 AI 加速计算,为实时自动驾驶工作负载优化 BPU 低批量、高性能。

而征程 5 芯片就是基于地平线 BPU 贝叶斯计算架构打造的。

同时,征程 5 也是国内首颗基于 ISO 26262 功能安全流程开发的 AI 芯片,也通过了 ISO 26262 ASIL-B 功能安全产品认证,满足 AEC-Q100 车规可靠性要求。

除了征程 5 芯片外,地平线还打造了包括整车智能开发平台、AI 开发套件、Matrix 5 域控参考平台、AI 软件栈、天工开物 AI 芯片工具链以及艾迪 AI 开发平台等等。能够满足 OEM 与生态伙伴的不同开发需求,还能够帮助他们在地平线的芯片上快速部署自动驾驶应用,并且降低开发适配和应用部署的成本。

只有算力还远远不够

在这个大算力芯片不断推陈出新、算力飙升的时代,地平线并没有选择一味鼓吹算力,而是更看重「真实 AI 效能」。

最开始,征程 5 发布时的基本参数为:

单芯片 AI 算力 128TOPS、1283FPS 计算性能、60ms 延迟、30W 功耗。

在前不久,地平线正式宣布征程 5 的计算性能得到了提升,从原有的 1283FPS 提升到了 1531FPS,而这些是在硬件架构和算法都没有变化的前提下做到的,唯一改变的只有软件架构。

那么,地平线是如何做到的?

之前,地平线提出了 AI 芯片的「新摩尔定律」:

真实 AI 效能 = 理论峰值算力 × 计算资源的有效利用率 × AI 算法效率。

其中,TOPS 决定了芯片的能力上限,但架构设计、操作系统、AI 算法将决定芯片上车后的稳定输出能力。

所以,当架构锁定、算法锁定的时候,其实还有软件架构还可以持续的改善,编译器还可以持续地把同样一个算法在同样一个芯片上通过编译、拆解、重组,部署和运行调度它。也正因此,让地平线征程 5 芯片在亮相一年之后的今天提升了 20% 左右的软件架构效率。

面对海外大厂,征程 5 有着怎样的表现?

英伟达 Orin 芯片在 2019 年发布,有着单芯片 254TOPS 算力的计算性能,目前已经有了较强的市场竞争力。相比之下,地平线征程 5 芯片在 128TOPS 的算力数据上似乎有着一定差距。

但根据地平线给出的数据,征程 5 运行典型分类模型时,在不同的模型上跑出的性能高低不同,但是大体上都是超过了 Orin 芯片。

在更接近自动驾驶场景的算法下,征程 5 针对典型检测模型比分类模型的性能优势更突出。同精度下,征程 5 达到近 3 倍于 Orin 的优势。

这些数据参数上表现,显现出了地平线注重 FPS 的优势,更高的 FPS 可以带来更低的延时,提升感知速度,这意味着在智能驾驶场景下将会进一步提升计算效率和安全性能。

而有这样表现,原因在于地平线的软硬结合。地平线的策略是「能让软件做的事情尽可能让软件做,硬件做简单、极致、高效且容易被软件灵活调用的功能」,从而带来了更高的真实 AI 效能。

前后夹击,腹背受敌

目前,英伟达在自动驾驶领域的主流芯片包括了 Xavier 以及更强的 Orin,而 Orin 芯片也在近两年被国内众多主推智能驾驶的 OEM 所采用,甚至有的已上车车型已经量产交付,比如蔚来 ET7。

英特尔在自动驾驶芯片上的发力,主要依靠的是 2017 年收购的 Mobileye。目前 Mobileye 共推出了 EyeQ1/2/3/4/5 五款芯片,分别用于应对不同级别的智能驾驶场景,EyeQ5H 芯片也在极氪 001 车型上搭载。虽然 Mobileye 的产品力现在来说可能不及其他对手的产品,但 Mobileye 凭借高效率、低功耗的特点,也有着极强的出货量。

高通在 2020 年推出了骁龙 Ride 系统,包含了芯片方案和传感器布局。通过不同数量芯片组合,最大可以实现 700TOPS 的算力需求,并且功耗为 130W。但目前的市场来看,高通最主流的产品还是数字座舱平台,尤其是高通骁龙 8155 芯片被国内不少 OEM 所采纳。

回到国内厂商身上,华为的智能驾驶平台主要基于其自主研发的鲲鹏系列芯片和昇腾系列芯片开发,推出的中央超算平台 ADCSC,最低算力为 400TOPS、高阶版本能够达到 800TOPS。而智能驾驶平台 MDC 系列目前也推出了 MDC810,算力可以达到 400TOPS。但目前上车率和出货量依然备受挑战。

黑芝麻智能推出的华山二号 A1000 芯片将在今年下半年江汽某款车型上正式搭载,这块芯片的算力达到 116TOPS。不过 116TOPS 是基于 INT4 量化处理,在 INT8 标准下为 58TOPS。而地平线征程 5 的 128TOPS 则也是基于 INT8 标准。

所以很明显的一点,地平线征程 5 芯片作为产品力极强的国产车规级 AI 芯片之一,面临的挑战也并不小。外有英伟达、英特尔以及高通在内的海外对手,内有华为、黑芝麻智能等国内厂商的不断追击。

最后

疫情期间的「芯片荒」让越来越多的人意识到,在智能时代一颗小小的芯片到底有多么重要。在智能汽车上,智能座舱与智能驾驶最基础的运算核心就是车规级 AI 芯片。

面对英伟达、英特尔、高通等强大的海外对手,车规级芯片的竞争厮杀异常残酷。像地平线、华为、黑芝麻智能等国内芯片厂商也在不断反击,而地平线的征程 5 芯片在其中扮演了极其重要的角色。

征程 5 的正式推出,让地平线成为能够覆盖从 L2 到 L4 智能驾驶芯片方案的提供商。如果说一年前征程 5 的发布代表了地平线的「新征程」,那么征程 5 的正式上车将代表着征程 5 的「新征程」。

目前,征程 5 已获得比亚迪、一汽红旗和自游家等多家车企的量产车型定点项目。

比亚迪股份有限公司董事长兼总裁王传福(左)
地平线创始人兼首席科学家余凯(右)

根据消息,搭载征程 5 芯片的比亚迪车型将会在 2023 年正式上市,而比亚迪也是同时选择了地平线和英伟达的车企之一。当征程 5 正式上车后,根据实际表现,很可能会为地平线的发展带来更好的提升、吸引更多的合作伙伴。

地平线作为国内为数不多的车规级 AI 芯片公司之一,征程 5 能否快速实现前装量产上车、会有怎样的出货量表现,也将会直接影响国内车规级 AI 芯片的发展格局。

本文著作权归作者所有,并授权 42 号车库独家使用,未经 42 号车库许可,不得转载使用。

评论 · 0

0/3
大胆发表你的想法~
1
评论