因?yàn)閰捑肓藶?a target="_blank">半導(dǎo)體付出高昂的代價(jià),因此通用汽車公司的自動(dòng)駕駛汽車部門決定開始自己設(shè)計(jì)芯片。這是一個(gè)大膽的舉動(dòng),但可能會(huì)讓汽車公司迷失方向。
就在 18 個(gè)月前,半導(dǎo)體巨頭 Nvidia展示了Cruise Origin Robotaxi,作為在 Cruise 汽車中使用圖形處理單元的案例研究,“以實(shí)時(shí)處理其車隊(duì)在舊金山混亂的街道上收集的大量數(shù)據(jù)。”
這家總部位于加利福尼亞的自動(dòng)駕駛汽車公司的硬件負(fù)責(zé)人Carl Jenkins最近告訴路透社,現(xiàn)在這種關(guān)系看起來已經(jīng)破裂,因?yàn)槭褂谩皝碜灾?yīng)商的 GPU”的成本高且回旋余地小。Nvidia 沒有直接點(diǎn)名,但它是僅有的兩家 GPU 供應(yīng)商之一,另一家 Advanced Micro Devices Inc. 不是汽車行業(yè)的參與者。
Cruise 并不是第一家使用英偉達(dá)芯片,然后放棄的汽車公司。三年前,特斯拉公司宣布將獨(dú)自開發(fā)用于其全自動(dòng)駕駛 (FSD) 計(jì)算機(jī)的芯片。當(dāng)時(shí),英偉達(dá)隨后發(fā)布了一篇詳細(xì)的博客文章,解釋了為什么特斯拉CEO Elon Musk 在評(píng)估性能差異時(shí)是錯(cuò)誤的。
實(shí)際上,Cruise、Tesla 和 Nvidia 都對(duì)他們的芯片為何優(yōu)越有充分的論據(jù)。當(dāng)汽車制造商幾乎沒有能力定制產(chǎn)品或談判價(jià)格時(shí),他們對(duì)支付高昂的芯片成本感到沮喪,這是可以理解的。但汽車行業(yè)的高管需要評(píng)估自己的核心競(jìng)爭(zhēng)力,并在走上獨(dú)立之路之前做出艱難的決定。
為此,他們可以從 Jeff Bezos 和盧森堡啤酒行業(yè)獲得指導(dǎo)。根據(jù) Amazon.com Inc. 創(chuàng)始人現(xiàn)在著名的演講,歐洲國家的釀酒商曾經(jīng)自己發(fā)電,因?yàn)檫@是啤酒制造過程中需要的輸入,他們無法從集中式電力中獲取電力網(wǎng)格。
但對(duì)這家釀酒商來說不幸的是,正如他在2008 年的一次演講中指出的那樣,這種繁重的工作沒有區(qū)別——所有的電力都是一樣的——但需要在世界級(jí)的水平上完成。他們?cè)娇鞂l(fā)電外包,他們就能越快重新專注于釀造。
“他們自己發(fā)電的事實(shí)并沒有讓他們的啤酒味道更好,”貝佐斯說。他的勸告今天繼續(xù)響亮:專注于讓您的啤酒味道更好的東西。
汽車制造商需要進(jìn)行同樣的計(jì)算,而且它的成本越來越高。過去十年,隨著半導(dǎo)體制造技術(shù)的進(jìn)步,開發(fā)新芯片的價(jià)格上漲了 10 倍。在將其送去生產(chǎn)之前,每個(gè)組件都需要進(jìn)行設(shè)計(jì)、驗(yàn)證、測(cè)試和原型制作。根據(jù)麥肯錫公司的分析,目前最新的 5 納米制造節(jié)點(diǎn)的前期成本為 5.4 億美元,而11 年前首次推出的較舊的 28 納米技術(shù)的前期成本為 5000 萬美元。
英偉達(dá)能夠承擔(dān)這些成本的一個(gè)主要原因是,它每年通過銷售用于計(jì)算機(jī)顯卡、人工智能服務(wù)器、數(shù)據(jù)處理中心和自動(dòng)駕駛汽車的芯片獲得 270 億美元的收入。設(shè)計(jì)芯片是英偉達(dá)的工作,因此半導(dǎo)體是英偉達(dá)的啤酒。
特斯拉和Cruise以及其他所有汽車制造商都需要詢問他們的產(chǎn)品與競(jìng)爭(zhēng)對(duì)手的區(qū)別是什么。駕駛員做出選擇的因素有很多,包括發(fā)動(dòng)機(jī)功率和性能、外觀、內(nèi)部設(shè)計(jì)、安全性和配件。未來,F(xiàn)SD 將只是買家考慮的另一個(gè)功能。
而且,設(shè)計(jì)自己的芯片并不能解決當(dāng)前的短期供應(yīng)短缺問題,但它可以讓汽車制造商更好地根據(jù)自己的需求定制組件,而不是購買現(xiàn)成的產(chǎn)品。性能很可能會(huì)優(yōu)于第三方供應(yīng)商可以提供的產(chǎn)品,但這并不意味著他們銷售的最終產(chǎn)品——汽車——會(huì)好得多。多年前, Alphabet Inc 的 Google走上了獨(dú)立之路,押注為其龐大的數(shù)據(jù)中心設(shè)計(jì)定制芯片的好處——并遠(yuǎn)離英特爾公司——這將使其投資獲得回報(bào)。大這里的不同之處在于,從谷歌服務(wù)器存儲(chǔ)和抽取的數(shù)據(jù)是世界上最大的搜索引擎購買和銷售的數(shù)據(jù)。
汽車制造商要確保他們的半導(dǎo)體賭注是值得的,他們不僅需要相信自動(dòng)駕駛功能將成為客戶購買決定的主要因素,而且他們自己內(nèi)部開發(fā)的芯片是這種差異化的關(guān)鍵。這是一項(xiàng)艱巨的任務(wù)。
經(jīng)過多年的發(fā)展,并與越來越高的成本作斗爭(zhēng),汽車制造商很有可能最終會(huì)發(fā)現(xiàn),雖然他們自己的芯片更出色,但它們并沒有讓啤酒的味道更好。
英偉達(dá)超強(qiáng)汽車芯片來襲
作為其秋季 GTC 2022 活動(dòng)的一部分,NVIDIA 早前發(fā)布了大量公告,該公司正在對(duì)其 DRIVE 汽車 SoC 計(jì)劃進(jìn)行令人驚訝的更行,且立即生效。NVIDIA表示將取消Atlan,這是他們計(jì)劃用于 2025 年汽車的后 Orin SoC。取而代之的是,NVIDIA 宣布推出 Thor,這是一款功能更強(qiáng)大的 SoC,將于 2025 年推出。
NVIDIA 的 Atlan SoC 于 2021 年春季 GTC 首次亮相,NVIDIA 宣布將其作為下一代汽車 SoC,以接替(現(xiàn)在的)Orin SoC。在宣布時(shí),Atlan 計(jì)劃成為一款高性能 SoC,提供 1000 TOPS 的 INT8 推理性能,采用下一代(Lovelace)GPU 設(shè)計(jì)和下一代 Grace CPU 設(shè)計(jì)。該芯片甚至集成了 BlueField DPU 作為網(wǎng)絡(luò)和安全處理器,旨在提供一個(gè)可以處理自動(dòng)駕駛汽車所需的所有計(jì)算功能的 SoC。
但無論 Atlan本應(yīng)是什么,現(xiàn)在都已不復(fù)存在。截至 NVIDIA 新的 DRIVE SoC 路線圖,Atlan 已被廢棄。取而代之的是一個(gè)新的 SoC——Thor,它比Atlan 更強(qiáng)大。
與 2021 年的 Atlan 公告一樣,NVIDIA 僅在發(fā)布之前發(fā)布了有關(guān) Thor 的少數(shù)細(xì)節(jié)。高級(jí)細(xì)節(jié)包括,沒有命名特定的 NVIDIA CPU 和 GPU 架構(gòu),但 SoC 正在利用 Grace CPU、Ampere GPU 架構(gòu)和 Lovelace GPU 架構(gòu)首次引入的功能。與此同時(shí),NVIDIA 關(guān)于此事的博客文章確實(shí)更進(jìn)一步,指出 SoC 使用了 Arm 迄今為止秘密的 Poseidon CPU 內(nèi)核的汽車增強(qiáng) (AE) 版本。我們對(duì)Poseidon 知之甚少,它是 Arm 正在開發(fā)的下一代高性能 CPU 內(nèi)核,將用于其下一代 Neoverse V 系列平臺(tái),取代剛剛發(fā)布的Neoverse V2。
從性能的角度來看,Thor 計(jì)劃使用新標(biāo)準(zhǔn)化的 FP8 數(shù)據(jù)格式提供 2 PFLOPS (2000 TFLOPS) 的浮點(diǎn)推理性能。盡管與 Atlan 的 1000 TFLOPS INT8 數(shù)字相比,這不是一個(gè)公平的比較,但它仍然代表了 8 位精度計(jì)算吞吐量的兩倍。SoC 的張量核心還將采用 NVIDIA 的 transformer engines,使 SoC 能夠進(jìn)一步加速transformer networks的處理。
值得注意的是,整合所有這些性能將使 Thor 成為一個(gè)非常龐大的芯片。雖然 NVIDIA 沒有宣布工藝節(jié)點(diǎn),但他們已經(jīng)表示它將使用 770 億個(gè)晶體管,這比他們的新旗艦 GH100 GPU 少了 30 億個(gè)晶體管。NVIDIA 的性能聲明并未表明是否使用了矩陣稀疏性,但即使是這樣,Thor 的 FP8 性能也將是 NVIDIA 旗艦 GPU 的一半。所有這些都突顯了 NVIDIA 對(duì)計(jì)劃中的 SoC 的極端性能目標(biāo)。
雖然 NVIDIA 的芯片模型在 AGX 板上以單芯片配置顯示它,但今天的公告還明確提到了 NVLink 芯片到芯片 (NVLink-C2C) 芯片互連技術(shù)。這是一個(gè)奇怪的提及,因?yàn)?NVIDIA 的關(guān)鍵藝術(shù)并沒有顯示 Thor 是基于chiplet的。這可能意味著 NVIDIA 將轉(zhuǎn)而使用 NVLink-C2C 來實(shí)現(xiàn)更強(qiáng)大的多芯片 DRIVE AGX 板(ala Pegasus),或者很可能 Thor 是基于chiplet的設(shè)計(jì),而 NVIDIA 故意將其通用化藝術(shù)。
除此之外,NVIDIA 沒有提供有關(guān) SoC 的任何進(jìn)一步技術(shù)細(xì)節(jié)。因此,有關(guān)使用的內(nèi)存類型、GPU 架構(gòu)和其他功能塊的詳細(xì)信息仍有待觀察。
在這一點(diǎn)上,NVIDIA 也沒有詳細(xì)說明為什么他們?nèi)∠?Atlan 來代替 Thor。Thor 無疑是一個(gè)更強(qiáng)大的設(shè)計(jì),并且似乎包含了一些在 Atlan 上找不到(或至少從未公開過)的新功能。這是否意味著 NVIDIA 正在以某種方式引入本應(yīng)是后 Atlan 芯片的芯片,或者他們是否因?yàn)榭蛻粜枰玫淖詣?dòng)駕駛汽車 AI 推理性能而放棄了 Atlan,還有待觀察。
拋開硬件升級(jí)不談,很明顯,NVIDIA 正在為與 Atlan 相同的細(xì)分市場(chǎng)設(shè)計(jì) Thor。也就是說,它是一種高性能的單芯片設(shè)計(jì),用于處理自動(dòng)駕駛汽車的所有計(jì)算需求,從信息娛樂系統(tǒng)和傳感器融合到實(shí)際的自動(dòng)駕駛算法本身。與 Atlan 一樣,其目標(biāo)是用一臺(tái)可以完成所有工作的計(jì)算機(jī)取代目前汽車內(nèi)的獨(dú)立計(jì)算機(jī),利用具有廣泛隔離(包括 MIG)的功能安全設(shè)計(jì)技術(shù)來防止單獨(dú)的任務(wù)相互干擾。
然而,也許最令人驚訝的是,SoC 的這種變化預(yù)計(jì)不會(huì)影響 NVIDIA 的 SoC 交付日期。英偉達(dá)表示,他們將在 2025 年為汽車廠商提供Thor,這與亞特蘭的計(jì)劃到達(dá)時(shí)間相同。因此,雖然魔鬼在細(xì)節(jié)中,但在高水平上,英偉達(dá)的目標(biāo)是提供接近相同的Thor時(shí)間,因?yàn)樗麄儠?huì)交付Atlan 。不過值得注意的是,雖然 NVIDIA 此前曾宣布 Atlan 將在 2023 年出樣,但尚未發(fā)布關(guān)于 Thor 的此類公告。因此,Thor 的送樣日期可能最終會(huì)晚于 Atlan 的送樣日期。
英偉達(dá)2019年對(duì)特斯拉自研芯片的評(píng)論原文
在2019年的特斯拉 Autonomy Day 投資者活動(dòng)中,埃隆·馬斯克 (Elon Musk) 公布了他的新型自動(dòng)駕駛汽車電腦的規(guī)格,他向全世界明確了幾件事。
首先,特斯拉正在提高所有其他汽車制造商的標(biāo)準(zhǔn)。
其次,特斯拉的自動(dòng)駕駛汽車將由基于其兩個(gè)新 AI 芯片的計(jì)算機(jī)提供動(dòng)力,每個(gè)芯片都配備 CPU、GPU 和深度學(xué)習(xí)加速器。該計(jì)算機(jī)每秒可提供 144 萬億次操作 (TOPS),使其能夠從一系列環(huán)繞攝像頭、雷達(dá)和超聲波收集數(shù)據(jù),并為深度神經(jīng)網(wǎng)絡(luò)算法提供動(dòng)力。
第三,特斯拉正在研發(fā)下一代芯片,據(jù)說 144 TOPS 還不夠。
在 NVIDIA,我們一直堅(jiān)信特斯拉重申的愿景:自動(dòng)駕駛汽車需要具備非凡能力的計(jì)算機(jī)。
這正是我們幾年前設(shè)計(jì)和制造 NVIDIA Xavier SoC 的原因。Xavier 處理器具有可編程 CPU、GPU 和深度學(xué)習(xí)加速器,可提供 30 TOPS的算力。我們基于雙芯片解決方案構(gòu)建了一臺(tái)名為 DRIVE AGX Pegasus 的計(jì)算機(jī),將 Xavier 與強(qiáng)大的 GPU 配對(duì)以提供 160 TOPS,然后將兩組放在計(jì)算機(jī)上,總共提供 320 TOPS。
正如我們一年前(2018年)宣布的那樣,我們并沒有坐以待斃。我們的下一代處理器 Orin 即將問世。
這就是為什么 NVIDIA 是馬斯克比較特斯拉的標(biāo)準(zhǔn)——我們是唯一一家以每秒數(shù)萬億次操作或 TOPS 來描述這個(gè)問題的公司。
但是,盡管我們?cè)诖缶稚贤馑挠^點(diǎn)——這是一個(gè)只能通過超級(jí)計(jì)算機(jī)級(jí)系統(tǒng)才能解決的挑戰(zhàn)——但特斯拉的演示文稿中存在一些我們需要糾正的不準(zhǔn)確之處。
將特斯拉的兩芯片全自動(dòng)駕駛計(jì)算機(jī)與英偉達(dá)的單芯片駕駛輔助系統(tǒng)的性能進(jìn)行比較是沒有用的。Tesla 的 144 TOP 的兩芯片 FSD 計(jì)算機(jī)將與NVIDIA DRIVE AGX Pegasus 計(jì)算機(jī)進(jìn)行比較,后者在 AI 感知、定位和路徑規(guī)劃方面以 320 TOPS 運(yùn)行。
此外,雖然 Xavier 提供了 30 TOPS 的處理能力,但特斯拉錯(cuò)誤地聲稱它提供了 21 TOPS。此外,帶有單個(gè) Xavier 處理器的系統(tǒng)是為輔助駕駛 AutoPilot 功能而設(shè)計(jì)的,而不是完全自動(dòng)駕駛。正如特斯拉所說,自動(dòng)駕駛需要更多的計(jì)算。
然而,特斯拉最重要的問題是完全正確的:自動(dòng)駕駛汽車——這是提高安全性、效率和便利性的關(guān)鍵——是該行業(yè)的未來。它們需要大量的計(jì)算性能。
事實(shí)上,特斯拉認(rèn)為這種方法對(duì)行業(yè)的未來非常重要,因此它正在圍繞它建立自己的未來。這是前進(jìn)的道路。其他所有汽車制造商都需要提供這種水平的性能。
只有兩個(gè)地方可以獲得 AI 計(jì)算能力:NVIDIA 和 Tesla。其中只有一個(gè)是可供行業(yè)構(gòu)建的開放平臺(tái)。
編輯:黃飛
?
評(píng)論