chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

挑戰(zhàn)英偉達,索尼AFEELA里的高通數(shù)字底盤

佐思汽車研究 ? 來源:佐思汽車研究 ? 2024-01-14 10:35 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

2024年CES展上,索尼用自家的PS5游戲機遙控原型車AFEELA登臺頗為驚艷,預(yù)計AFEELA在2025年上市,起售價約為45000美元,首選發(fā)售地據(jù)悉是北美。AFEELA是高通數(shù)字底盤的典型代表。

AFEELA具備800TOPS的算力。

76159edc-b279-11ee-8b88-92fbcf53809c.png

圖片來源:SHM

762b18e8-b279-11ee-8b88-92fbcf53809c.png

圖片來源:SHM

AFEELA顯然是采用了兩套SnapdragonRide級聯(lián),推測SoC是高通的SA8650,加速器是基于Cloud AI 100 Ultra的車載版。

AFEELA的AD/ADAS架構(gòu)

763e7280-b279-11ee-8b88-92fbcf53809c.png

圖片來源:SHM

上圖是AFEELA的AD/ADAS架構(gòu),不要質(zhì)疑CNN做感知,即便是2000TOPS的英偉達也支撐不起全Transformer,車載感知的Backbone網(wǎng)絡(luò)還是基于CNN的,包括特斯拉,特斯拉是Regnet。只有Head才能用得上Transformer,這里的環(huán)境模型基本可等同于BEV加占用網(wǎng)絡(luò)。全Transformer估計得用8張英偉達H200顯卡,價格是整車的好幾倍了。

SA8650之前筆者已介紹過,高通第一代Snapdragon Ride即SA8540P+SA9000P似乎是過渡產(chǎn)品,SA8540P和高通的SA8295P幾乎完全一致,與高通筆記本電腦領(lǐng)域的8cx Gen3即SC8280P也幾乎完全一致。

高通自動駕駛一直在英偉達和Mobileye的夾縫中,英偉達憑借超高性能幾乎壟斷高端市場,而Mobileye以40-70美元的超低價格壟斷中低端市場。對大部分廠家,包括保時捷這樣的高端品牌,對自動駕駛都缺乏興趣和重視度,自動駕駛是可有可無,錦上添花的配置,只有Mobileye不到100美元的芯片能滿足這些廠家的成本需求,Mobileye牢牢占據(jù)全球70%的智能駕駛芯片市場,地位穩(wěn)如泰山,短期的客戶庫存調(diào)整不會影響Mobileye的未來。高通無意與Mobileye競爭,可能是利潤太微薄,高通主要競爭對手就是英偉達,但高通主要市場還是手機,技術(shù)核心還在手機上,所以高通的AI加速器是分離的,高通主打的是低功耗和高性價比。

今天我們主要來看高通AI加速器的新產(chǎn)品,即AI 100 Ultra,這是高通2023年11月底推出的產(chǎn)品,就是要挑戰(zhàn)英偉達的H100,高通號稱單張AI 100 Ultra可以對應(yīng)1000億參數(shù)的大模型,兩張可以對應(yīng)1750億參數(shù)的ChatGPT 3,功耗和價格遠低于英偉達的H100,惠普和聯(lián)想已經(jīng)有基于AI 100 Ultra的服務(wù)器銷售。

7655cc46-b279-11ee-8b88-92fbcf53809c.png

上表是高通2020年9月推出AI 100的各個版本的性能表現(xiàn)。高通目前只有這兩款A(yù)I加速器,車載的AI加速器毫無疑問是基于AI 100設(shè)計的。

766c8918-b279-11ee-8b88-92fbcf53809c.png

從參數(shù)上看,當(dāng)然無法和英偉達H100相提并論,并且H100主打的是FP16精度,高通主打的是INT8精度,高通主要的信心來自其軟件優(yōu)化,即Polyhedral Mapper。

76802bc6-b279-11ee-8b88-92fbcf53809c.png

特色主要是核心/線程的并行性,明確的數(shù)據(jù)傳輸,以及SIMD的并行性。

7692dd48-b279-11ee-8b88-92fbcf53809c.png

上圖是一個具體的BERT優(yōu)化。

76aac80e-b279-11ee-8b88-92fbcf53809c.png

主要的挑戰(zhàn)一是如何讓核心、線程和矢量單元都處于最大利用狀態(tài),二是如何利用好本地內(nèi)存,而不是外部昂貴的HBM內(nèi)存,三是減少數(shù)據(jù)搬運。

高通AI加速器架構(gòu)

76c9cb46-b279-11ee-8b88-92fbcf53809c.png

高通AI 100內(nèi)核

76e31ae2-b279-11ee-8b88-92fbcf53809c.png

高通AI 100內(nèi)核是16個,AI 100Ultra是64個,不過考慮到功耗,性能沒有增加4倍。

每個AI核心內(nèi)部架構(gòu)

76f6c114-b279-11ee-8b88-92fbcf53809c.jpg

大多數(shù)車載AI加速器只有張量Tensor計算單元,且只有INT8,高通的不僅包括張量還有標量Scalar和矢量Vector單元。張量分INT8和FP16兩種,INT8有8192個MAC,F(xiàn)P16有4096個MAC。標量與矢量單元都是VLIW指令集,跟高通手機芯片中的DSP完全一致。

每核心有1MB的L2緩存,有8MB的VTCM存儲,所謂VTCM是VectorTightly-Coupled Memory緊耦合矢量存儲,合計每個AI核心有9MB的SRAM,64個內(nèi)核就是576MB的SRAM,SRAM的成本每MB約5美元,也就是2880美元,AI 100 Ultra至少一半以上的die size是SRAM,一半以上的成本也來自SRAM,估計AI 100 Ultra售價是6000美元左右。

矢量計算需要頻繁搬運數(shù)據(jù),特別是矢量矩陣運算,Transformer里主要延遲都來自矢量矩陣運算。

770b91d4-b279-11ee-8b88-92fbcf53809c.png

上圖是三星對GPT大模型workload分析,在運算操作數(shù)量上,GEMV矩陣矢量乘法所占的比例高達86.53%,在大模型運算延遲分析上,82.27%的延遲都來自GEMV;GEMM矩陣通用乘法所占僅為2.12%,非線性運算也就是神經(jīng)元激活部分占的比例也遠高于GEMM。

77269f2e-b279-11ee-8b88-92fbcf53809c.png

上圖是三星對GPU利用率的分析,可以看出在GEMV算子時,GPU的利用率很低,一般不超過20%,換句話說80%的時間GPU都是在等待存儲數(shù)據(jù)的搬運。所以芯片內(nèi)部的TCAM非常有必要,其效果要比芯片外部的HBM更好,缺點是容量遠不能和HBM比,用于訓(xùn)練和汽車級模型推理比較好。

AI 100 Ultra的存儲系統(tǒng)升級不少,從原來的137GB/s升級至576GB/s,但還是用了老舊的LPDDR4,實際就是內(nèi)存控制器增加到了4路,每路128bit,合計512bit。接口方面,PCIe提升到第四代,Lane增加到16。

AI加速器硬件似乎已走到了盡頭,能做文章的只有存儲部分和制造工藝,更先進的制造工藝容納更多的計算單元,更高bit的內(nèi)存控制器增加存儲帶寬或者升級HBM,像英偉達的H200,只是存儲部分更換成了HBM3,其余與H100完全一致。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 加速器
    +關(guān)注

    關(guān)注

    2

    文章

    833

    瀏覽量

    39632
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5050

    瀏覽量

    134021
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    37210

    瀏覽量

    291863
  • 自動駕駛
    +關(guān)注

    關(guān)注

    791

    文章

    14560

    瀏覽量

    174583

原文標題:挑戰(zhàn)英偉達,索尼AFEELA里的高通數(shù)字底盤

文章出處:【微信號:zuosiqiche,微信公眾號:佐思汽車研究】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    通展示驍龍數(shù)字底盤產(chǎn)品組合的最新成果

    今日,在2025通汽車技術(shù)與合作峰會上,通技術(shù)公司攜手中國先進車企和生態(tài)系統(tǒng)合作伙伴,展示其驍龍數(shù)字底盤產(chǎn)品組合的發(fā)展勢頭和最新成果。驍龍數(shù)字
    的頭像 發(fā)表于 07-03 12:55 ?905次閱讀

    英偉擬再推中國特供GPU,今年6月量產(chǎn)!

    電子發(fā)燒友網(wǎng)綜合報道 近年來,美國政府對華半導(dǎo)體出口管制政策不斷收緊,英偉等半導(dǎo)體企業(yè)面臨嚴峻挑戰(zhàn)。為保持在中國市場的競爭力,英偉推出了
    發(fā)表于 05-27 00:03 ?4549次閱讀

    英偉市值一夜蒸發(fā)近2萬億 英偉股價下跌超8%

    在美東時間周一,美股三大指數(shù)集體收跌,截至收盤,英偉股價下跌超8%,英偉市值一夜蒸發(fā)2650億美元(換算下來約合人民幣19345億元);目前英偉
    的頭像 發(fā)表于 03-04 10:19 ?888次閱讀

    英偉殺瘋了!Blackwell橫掃市場,AMD、英特爾加入降本浪潮

    。與此同時,隨著AI大模型的普及,計算量需求和成本壓力也成為行業(yè)關(guān)注的焦點。如何在性能與成本之間找到平衡,成為整個AI芯片行業(yè)共同面臨的挑戰(zhàn)。AI大模型的出現(xiàn)對芯片市場產(chǎn)生了哪些影響,DeepSeek帶來的“AI降本浪潮”又會給AMD和英特爾帶來哪些機會? ?
    的頭像 發(fā)表于 03-02 00:02 ?2283次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達</b>殺瘋了!Blackwell橫掃市場,AMD、英特爾加入降本浪潮

    英偉78%員工已成百萬富翁

    近日,一則關(guān)于英偉員工的財富消息引起了廣泛關(guān)注。據(jù)最新數(shù)據(jù)顯示,英偉已有78%的員工成為了百萬(美元)富翁,這一數(shù)字令人咋舌。然而,在這
    的頭像 發(fā)表于 01-13 13:51 ?757次閱讀

    英偉通或轉(zhuǎn)單三星2納米工藝

    近日,據(jù)SamMobile的最新消息,英偉通兩大芯片巨頭正在考慮對其2納米工藝芯片的生產(chǎn)策略進行調(diào)整。具體來說,這兩家公司正在評估將部分原計劃在臺積電生產(chǎn)的2納米工藝訂單轉(zhuǎn)移至三星的可能性
    的頭像 發(fā)表于 01-06 10:47 ?573次閱讀

    剛剛!英偉最新回應(yīng)!

    12月10日消息,據(jù)報道,英偉市值一夜蒸發(fā)掉了889億美元(約合人民幣6460億元)。 據(jù)此前媒體報道,近日英偉公司因涉嫌違反《中華人民共和國反壟斷法》及《市場監(jiān)管總局關(guān)于附加限制
    的頭像 發(fā)表于 12-10 18:13 ?1068次閱讀

    英偉被立案調(diào)查 英偉回應(yīng)反壟斷調(diào)查

    英偉被立案調(diào)查!?國家市場監(jiān)督管理總局在12 月 9 日晚宣布,英偉公司涉嫌違反《中華人民共和國反壟斷法》及《市場監(jiān)管總局關(guān)于附加限制性條件批準
    的頭像 發(fā)表于 12-10 15:03 ?705次閱讀

    Tenstorrent獲7億美元融資,貝索斯參投挑戰(zhàn)英偉

    AI芯片初創(chuàng)公司Tenstorrent近日宣布獲得高達7億美元的融資,公司估值也隨之攀升至26億美元。此次融資旨在挑戰(zhàn)英偉在AI芯片市場的領(lǐng)導(dǎo)地位,推動更加親民和高效的AI解決方案的發(fā)展
    的頭像 發(fā)表于 12-03 11:07 ?1053次閱讀

    英偉第三季度營收幾乎翻倍 但英偉美股盤后一度跌近5%

    英偉一直備受關(guān)注,在人工智能大浪潮下,英偉股價在2024年已上漲近200%。 英偉第三季度
    的頭像 發(fā)表于 11-21 16:33 ?1264次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達</b>第三季度營收幾乎翻倍 但<b class='flag-5'>英偉</b><b class='flag-5'>達</b>美股盤后一度跌近5%

    英偉計劃2025年推出基于Arm架構(gòu)的消費級CPU,挑戰(zhàn)英特爾和AMD

    11月5日,據(jù)科技媒體DigiTimes于10月31日報道,供應(yīng)鏈消息透露,英偉(Nvidia)正計劃在2025年9月推出其首款基于Arm架構(gòu)的消費級CPU,目標直指高端PC市場。   據(jù)悉
    的頭像 發(fā)表于 11-05 15:29 ?2041次閱讀

    英偉超越蘋果成為市值最高 英偉取代英特爾加入道指

    在AI浪潮下英偉被各路資本競相追逐,2024年英偉公司的股價累計上漲高達180%。在11月4日,英偉
    的頭像 發(fā)表于 11-05 15:22 ?984次閱讀

    成全球最高!英偉市值超蘋果

    近日,全球圖形處理器(GPU)巨頭英偉公司的股價在當(dāng)日交易中上漲了1.4%,使其總市值達到了驚人的3.37萬億美元,成功超越了蘋果公司,重新成為全球市值最高的公司。 這一程碑式的成就凸顯了
    的頭像 發(fā)表于 11-05 14:53 ?819次閱讀

    英偉市值欲超蘋果面臨挑戰(zhàn),美研究機構(gòu)稱穩(wěn)居榜首不易

     據(jù)路透社26日報道,當(dāng)?shù)貢r間25日,英偉股價創(chuàng)下歷史新高,一度超越蘋果,成為全球市值最高的公司。倫敦證券交易所的數(shù)據(jù)顯示,英偉股票市值一度達到3.53萬億美元,而蘋果市值為3.5
    的頭像 發(fā)表于 10-28 17:02 ?1190次閱讀