最近特斯拉再次成為了焦點(diǎn)。一方面,CEO馬斯克在推特的一舉一動(dòng)引發(fā)話(huà)題;另一方面特斯拉公司陷入各種困境:上海工廠停產(chǎn)計(jì)劃延期、大量訂單被取消、股市表現(xiàn)崩盤(pán)......
山雨欲來(lái)風(fēng)滿(mǎn)樓,內(nèi)憂(yōu)外患之中的特斯拉身上的光環(huán)似乎正在變?nèi)?。盡管存在許多挑戰(zhàn),特斯拉自研芯片的進(jìn)度卻并沒(méi)有太受影響。近日供應(yīng)鏈消息顯示,特斯拉將使用臺(tái)積電4納米制程打造其下一代自動(dòng)駕駛芯片,這一訂單可能會(huì)讓特斯拉成為臺(tái)積電第七大客戶(hù)。特斯拉在自研芯片上的努力,對(duì)于其他車(chē)企來(lái)說(shuō)又能學(xué)到什么?
特斯拉的造芯之路
2021年在全球車(chē)企因缺芯大幅減產(chǎn)的時(shí)候,2021年特斯拉美國(guó)和中國(guó)的工廠開(kāi)工率一直保持著9成左右,數(shù)據(jù)顯示2021年特斯拉全球交付量超過(guò)93萬(wàn),同比增長(zhǎng)了87%。在各大車(chē)廠都因?yàn)槿毙景l(fā)愁時(shí),“特斯拉為何不缺芯”成為了各個(gè)車(chē)廠研究的課題。
究其原因,一方面,特斯拉在新冠疫情擴(kuò)大的情況下也并未下調(diào)產(chǎn)量計(jì)劃,這對(duì)其從零部件廠商手中獲得穩(wěn)定采購(gòu)發(fā)揮了有益作用。另一方面,特斯拉針對(duì)缺貨的半導(dǎo)體,通過(guò)改寫(xiě)軟件為這些產(chǎn)品找到了替代品,由此減少了半導(dǎo)體缺貨對(duì)生產(chǎn)帶來(lái)的影響。由此可見(jiàn),掌握芯片核心技術(shù),是特斯拉的競(jìng)爭(zhēng)力之一。
特斯拉的造芯之路經(jīng)歷了從買(mǎi)到造的過(guò)程。特斯拉的智能駕駛功能經(jīng)歷了從 Autopilot 1.0 到 Autopilot 2.0、再到 FSD(Full-Self Driving)的迭代升級(jí),其硬件系統(tǒng)也從 Hardware 1.0 逐步升級(jí)至 Hardware 3.0。
在 HW 1.0 時(shí)代,特斯拉采用了來(lái)自 Mobileye 的 EyeQ 系列芯片。進(jìn)入 HW 2.0 時(shí)代,特斯拉找到了英偉達(dá)作為 Mobileye 的替代,采用定制版的英偉達(dá) Drive PX2 自動(dòng)駕駛計(jì)算平臺(tái)(由 1 顆 Tegra Parker 芯片和 1 顆 Pascal 架構(gòu) GPU 芯片構(gòu)成)。后來(lái)又升級(jí)為 HW 2.5,增加了一顆 Tegra Parker 芯片。但馬斯克認(rèn)為無(wú)論是Mobileye還是Nvidia,都無(wú)法滿(mǎn)足特斯拉對(duì)于性能、研發(fā)進(jìn)度、成本、功率方面的要求。自此,特斯拉走上了自研芯片之路。
2016年,前AMD 首席架構(gòu)師Jim Keller加入特斯拉,任職Autopilot硬件工程師總裁。自此,特斯拉開(kāi)啟了自研芯片之路。
特斯拉的自研芯片
特斯拉的自研芯片F(xiàn)SD用于HW 3.0 完全自動(dòng)駕駛計(jì)算平臺(tái)中。2018 年 12 月,特斯拉開(kāi)始使用新的硬件和軟件堆棧對(duì)員工汽車(chē)進(jìn)行改造。2019 年 3 月,特斯拉開(kāi)始在其 Model S 和 Model X 汽車(chē)中批量出貨 FSD 芯片和計(jì)算機(jī)。特斯拉 Model 3 的量產(chǎn)發(fā)貨于 2019 年 4 月開(kāi)始。
FSD芯片采用三星的14納米工藝。包含 3 個(gè)四核Cortex-A72集群,總共 12 個(gè) 2.2 GHz 的 CPU,一個(gè) 1 GHz 的 Mali G71 MP12 GPU,2個(gè)2 GHz 的神經(jīng)處理單元,以及各種其他硬件加速器。FSD的圖像處理器能夠提供0.6TFLOPS計(jì)算能力,運(yùn)行頻率為1GHz;2個(gè)神經(jīng)網(wǎng)絡(luò)處理器運(yùn)行在2.2GHz頻率下能提供72TOPS的處理能力。
為了提升神經(jīng)網(wǎng)絡(luò)處理器的內(nèi)存存取速度以提升計(jì)算能力,每顆FSD芯片內(nèi)部還集成了32MB高速緩存。HW 3.0的圖像處理速度提升了21倍,成本降低了20%,代價(jià)僅僅是功耗從 57w 增加到了 72w。
安全系統(tǒng)方面FSD包含一個(gè)雙核鎖步CPU,該CPU對(duì)汽車(chē)執(zhí)行器進(jìn)行最后決策,該CPU確定FSD控制器上的兩個(gè)FSD芯片生成的兩個(gè)策略是否匹配,以及是否可以安全地驅(qū)動(dòng)執(zhí)行器。在相機(jī)接口方面,F(xiàn)SD芯片具有一個(gè)攝像頭串行接口,該接口能夠進(jìn)行每秒高達(dá)25億像素的處理。
在視頻編碼器方面,F(xiàn)SD芯片集成了H.265(HEVC)視頻編碼器,可用于各種應(yīng)用,例如備用攝像頭的顯示,行車(chē)記錄儀和云剪輯記錄等。在圖像信號(hào)處理器方面,F(xiàn)DS芯片集成了內(nèi)部帶有24bit流水線的信號(hào)處理器(ISP),該流水線旨在處理特斯拉汽車(chē)上配備的八個(gè)HDR傳感器,并能夠每秒處理十億像素。而且具有降噪能力。
在神經(jīng)處理單元方面,F(xiàn)SD芯片集成了兩個(gè)定制的NPU,每個(gè)NPU都封裝了32MB的SRAM,用于存儲(chǔ)臨時(shí)數(shù)據(jù),從而減少數(shù)據(jù)存入主存儲(chǔ)器。
每個(gè)周期,NPU從SRAM讀取256字節(jié)的激活數(shù)據(jù)和另外128字節(jié)的權(quán)重?cái)?shù)據(jù)到MAC陣列中。每個(gè)NPU擁有96x96 MAC,另外在精度方面,乘法為8x8bit,加法為32bit,兩種數(shù)據(jù)類(lèi)型的選擇很大程度上取決于他們降功耗的努力。在2GHz的工作頻率下,每個(gè)NPU的算力為36.86TOPS,F(xiàn)SD芯片峰值算力為73.7TOPS。在點(diǎn)積運(yùn)算之后,數(shù)據(jù)轉(zhuǎn)移到激活硬件,最后寫(xiě)入緩存,以匯總結(jié)果。FSD支持許多激活功能,包括ReLU、SiLU和TanH。每個(gè)周期,將128字節(jié)的數(shù)據(jù)寫(xiě)回SRAM。所有操作同時(shí)且連續(xù)地進(jìn)行,重復(fù)直到完成整個(gè)計(jì)算。
特斯拉將一些硬件簡(jiǎn)化,雖然這會(huì)增加軟件的復(fù)雜性,但這樣可以降低芯片的成本。
只有深入了解軟硬件之間的相互作用是什么,才能清楚到底應(yīng)該用什么樣的芯片去支持什么樣的算法。FSD芯片徹底奠定了特斯拉在自動(dòng)駕駛領(lǐng)域的領(lǐng)先地位。通過(guò)自研芯片特斯拉讓硬件能與自家的軟件算法更加契合,獲得更好的兼容性和匹配度,提升產(chǎn)品核心競(jìng)爭(zhēng)力。
特斯拉除了在自動(dòng)駕駛芯片上有成果,更是在2022年推出了Dojo處理器芯片。該芯片由臺(tái)積電制造,采用7納米制造工藝,擁有500億個(gè)晶體管,芯片面積為645mm2,小于英偉達(dá)的A100(826 mm2)和AMD Arcturus(750 mm2)。據(jù)Dojo項(xiàng)目負(fù)責(zé)人Ganesh Venkataramanan介紹,特斯拉Dojo是史上最快的AI訓(xùn)練計(jì)算機(jī)。相比于業(yè)內(nèi)其他芯片,同成本下性能提升4倍,同能耗下性能提高1.3倍,占用空間節(jié)省5倍。而使得Dojo完成訓(xùn)練AI算法的重任,就是特斯拉自研神經(jīng)網(wǎng)絡(luò)訓(xùn)練芯片——D1芯片。
一家車(chē)企,不但攻克了自動(dòng)駕駛芯片,還攻克了AI芯片。這樣的車(chē)企在現(xiàn)階段只有特斯拉一家,這是特斯拉在同行中芯片研發(fā)實(shí)力最好的體現(xiàn)。
特斯拉的特別之處
人們總把特斯拉與蘋(píng)果相提并論,特斯拉高度的定制化,是市場(chǎng)將特斯拉視作另一個(gè)蘋(píng)果的重要原因。與蘋(píng)果一樣,特斯拉經(jīng)歷了買(mǎi)芯片到完全自主研發(fā)的過(guò)程。蘋(píng)果從過(guò)去產(chǎn)品高度依賴(lài)英特爾的芯片,到現(xiàn)在M系產(chǎn)品性能完全不輸英特爾。特斯拉也是從依靠英特爾、英偉達(dá)到自研核心芯片。
同蘋(píng)果一樣,特斯拉是臺(tái)積電的大客戶(hù)。根據(jù)預(yù)測(cè)特斯拉或?qū)⒃?022年成為臺(tái)積電第七大客戶(hù);此外,據(jù)產(chǎn)業(yè)內(nèi)消息,特斯拉Hardware 4.0 將由臺(tái)積電代工并在美國(guó)生產(chǎn),未來(lái)特斯拉在對(duì)于臺(tái)積電或許會(huì)更加重要。業(yè)界以特斯拉生產(chǎn)計(jì)劃預(yù)估,特斯拉明年生產(chǎn)規(guī)模將有望從300萬(wàn)輛起跳。如果特斯拉最新自動(dòng)駕駛芯片在 2023 年開(kāi)始量產(chǎn),并且在 2024 年開(kāi)始大批量上車(chē)的話(huà),那么特斯拉的仍然會(huì)處于全球最領(lǐng)先的水平。
對(duì)比其他車(chē)企造芯的情況
話(huà)說(shuō)回來(lái),車(chē)企造芯并不是什么新鮮事。雖然中國(guó)造車(chē)新勢(shì)力都宣稱(chēng)要開(kāi)啟自研自動(dòng)駕駛芯片之路,但特斯拉是首先拿出成果,實(shí)現(xiàn)自動(dòng)駕駛芯片量產(chǎn)的車(chē)企。還有一批車(chē)企,更多的是通過(guò)合作、投資其他公司的方式布局芯片賽道;并且他們選擇了門(mén)檻相對(duì)較低的MCU、IGBT等芯片。在沒(méi)有新的車(chē)企發(fā)布自研芯片之前,特斯拉仍將在同行中一騎絕塵。畢竟這么多年,也沒(méi)有幾個(gè)手機(jī)廠超越了蘋(píng)果。
離不開(kāi)中國(guó)市場(chǎng)的特斯拉
中國(guó)市場(chǎng)是新能源汽車(chē)最大的市場(chǎng),作為電動(dòng)汽車(chē)銷(xiāo)量最高的車(chē)企,特斯拉離不開(kāi)中國(guó)市場(chǎng)。為了降低成本,特斯拉也在中國(guó)投資了多個(gè)企業(yè)。特斯拉在中國(guó)山東濟(jì)南成立合資企業(yè),注冊(cè)資本額為1.5 億美元。顯示特斯拉除了正在利用臺(tái)積電龐大的產(chǎn)能,為自己的車(chē)用與超級(jí)運(yùn)算的芯片提供重要來(lái)源之外,也在車(chē)用芯片的設(shè)計(jì)上積極布局。
根據(jù)上圖,特斯拉帶動(dòng)了相當(dāng)一部分中國(guó)的供應(yīng)商的業(yè)務(wù)。對(duì)于中國(guó)供應(yīng)商來(lái)說(shuō),特斯拉來(lái)了,為了跟成本更低的中國(guó)品牌競(jìng)爭(zhēng),肯定要大規(guī)模國(guó)產(chǎn),這導(dǎo)致供應(yīng)鏈必然更傾向于中國(guó)本地廠商或者將原供應(yīng)商引入中國(guó)。不管怎么樣,特斯拉對(duì)應(yīng)的供應(yīng)鏈、產(chǎn)業(yè)鏈要在中國(guó)落地生根。這也就帶動(dòng)了中國(guó)的新能源汽車(chē)供應(yīng)鏈。
總的來(lái)看,雖然面臨著多事之冬,特斯拉的芯片實(shí)力仍在。如果說(shuō)特斯拉在芯片領(lǐng)域存在競(jìng)爭(zhēng),那么最大的對(duì)手并非其他車(chē)企,而是來(lái)自英偉達(dá)與高通。就在特斯拉自研芯片發(fā)布后,英偉達(dá)推出了最新的Orin 芯片,單芯片算力還是計(jì)算平臺(tái)算力達(dá)到了250TFLOP;2020 年初,高通發(fā)布了 Snapdragon Ride 自動(dòng)駕駛計(jì)算平臺(tái),其算力和能效比都碾壓了特斯拉 HW 3.0;2022年英偉達(dá)公布Thor芯片,單顆芯片算力達(dá)到2000TFLOPS,將于2025量產(chǎn),這一芯片更是將汽車(chē)芯片算力帶到了新時(shí)代。
隨著汽車(chē)算力競(jìng)賽開(kāi)啟,特斯拉還能領(lǐng)先多久?或許正在推特忙碌的馬斯克,并不知道答案。