chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

卡都去哪了?AI超算成了GPU的無底黑洞

E4Life ? 來源:電子發(fā)燒友 ? 作者:周凱揚(yáng) ? 2024-06-26 09:03 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))AI大模型似乎陷入了一個(gè)怪圈,盡管對于深度學(xué)習(xí)、數(shù)據(jù)優(yōu)化和爆款應(yīng)用的研究從來沒有終止,但大多數(shù)人開口問的第一句話就是,“你有卡嗎”?從行業(yè)對GPU的狂熱追求來看,未來繼續(xù)擴(kuò)展大模型的機(jī)會,似乎只會被大公司掌握在手中。

xAI拉攏戴爾和超微打造AI超算,馬斯克繼續(xù)買買買

xAI作為2023年3月才成立的一家初創(chuàng)公司,在構(gòu)建算力基礎(chǔ)設(shè)施的投入上卻一點(diǎn)也不含糊,不過這也多虧了背后的金主埃隆馬斯克。近日,戴爾CEO Michael Dell宣布他們正在打造一個(gè)由英偉達(dá)GPU驅(qū)動(dòng)的AI工廠,為xAI的Grok模型提供動(dòng)力。不過馬斯克隨即表示,戴爾只是其中一半服務(wù)器集群的供應(yīng)商,另外一半的超算系統(tǒng)則是由超微打造。

由此推測,這一AI工廠應(yīng)該就是馬斯克在月初提到的10萬塊H100液冷訓(xùn)練集群了,盡管有兩家供應(yīng)商同時(shí)為xAI打造服務(wù)器,但市面上的GPU需求依然維持在高位,還需要幾個(gè)月這一集群才會正式上線,用于Grok的下一代大模型迭代。

H100這張2023年發(fā)布的GPU可以說是目前全球大模型算力供應(yīng)的主力,無論是OpenAI還是xAI,其最新模型都是基于該GPU訓(xùn)練迭代的。H100無論是顯存容量、帶寬和算力性能都實(shí)現(xiàn)了一輪新的突破,甚至可以說H100帶動(dòng)了這一代AI大模型的發(fā)展,然而在GTC之后,馬斯克已經(jīng)開始眼饞最新的B200了。他認(rèn)為考慮到目前的技術(shù)演進(jìn)速度,實(shí)在不值得把1GW的電力供應(yīng)給H100。

為此xAI也已經(jīng)開始在規(guī)劃下一代系統(tǒng),據(jù)馬斯克透露,該系統(tǒng)將由30萬塊B200 GPU組成,但上線時(shí)間需要等到明年夏天了。B200速度高達(dá)H100的4倍,更是可以輕松做到單機(jī)柜1exaflop的算力表現(xiàn),更何況在能耗成本上,B200相比H100改善了20多倍,即便是大規(guī)模部署,也不會讓廠商面臨供電和碳足跡的雙重困擾。

盡管xAI的AI超算目標(biāo)已經(jīng)明確,但對于馬斯克旗下的另一家公司特斯拉而言,其技術(shù)路線依舊不算明朗。雖然特斯拉也開啟了新一輪的英偉達(dá)GPU采購潮,但其內(nèi)部也在繼續(xù)發(fā)展自研的Dojo超算。只不過近年來Dojo的情報(bào)越來越少,就連馬斯克自己也將其列入“遠(yuǎn)景計(jì)劃”之列。

OpenAI與微軟,“鯨級”超算已在全速運(yùn)轉(zhuǎn)中

相信不少人都還記得去年11月首度上榜TOP500的微軟超算Eagle,這臺空降第三的AI超算憑借14400個(gè)英偉達(dá)H100和561PFlop/s的算力,不僅讓Azure系統(tǒng)再次闖進(jìn)了前十,還拿下了當(dāng)下云端超算最高的排名。而當(dāng)時(shí)的Azure還未部署完成,雖然最新的排名中Eagle依然維持在第三的位置,但其核心數(shù)已經(jīng)近乎翻倍。

這臺超算為OpenAI的GPT-4訓(xùn)練和推理提供了極大的助力,但這遠(yuǎn)沒有達(dá)到微軟的財(cái)力極限。早在3月底,就有消息傳出微軟和OpenAI正在打造一個(gè)代號名為“星門”的AI超算,耗資高達(dá)1000億美元。微軟CTO Kevin Scott稱不少有關(guān)其超算計(jì)劃的推測簡直錯(cuò)得可笑,但也指出他們確實(shí)會為這一計(jì)劃付出不少努力和成本。

在上個(gè)月舉辦的Microsoft Build中,Kevin Scott公開透露了他們未來的超算擴(kuò)展計(jì)劃。2020年,微軟為OpenAI打造了第一臺AI超算,正是因?yàn)檫@臺機(jī)器才孕育了GPT-3。而他們構(gòu)建的下一個(gè)系統(tǒng),也就是Eagle,則用于訓(xùn)練GPT-4。Kevin Scott選擇了用海洋生物來描述這些超算的規(guī)模,比如首臺超算可以用鯊魚來描述,Eagle則是虎鯨,而他們的下一臺超算規(guī)模則可以比擬藍(lán)鯨。

Kevin Scott更是強(qiáng)調(diào),別看現(xiàn)在Eagle可以排到第三名的位置,從現(xiàn)在開始微軟每個(gè)月都會部署五臺同樣規(guī)模的超算,也就是說每月都有至少搭載72000個(gè)H100 GPU或同等規(guī)模系統(tǒng)投入應(yīng)用,每月帶來2.8exaflops的算力增長。同時(shí),他們用來連接GPU的高速和InfiniBand線纜可以繞地球至少五周,也就是說長度在20萬公里以上總線纜長度。

很明顯,作為已經(jīng)憑借OpenAI獲得成功的微軟來說,接下來需要贏下的就是這場Scaling之戰(zhàn)。

TPU和GPU并用,谷歌的Hypercomputer

盡管不少巨頭都在考慮如何自研芯片來降低購置海量GPU帶來的成本,但真的成功將其用于大模型的訓(xùn)練中去的,已經(jīng)迭代至第六代的谷歌TPU,恰好就為谷歌解決了這個(gè)問題。TPU作為谷歌和博通聯(lián)合設(shè)計(jì)了幾代的產(chǎn)品,在谷歌自己推出的各種新模型訓(xùn)練與推理中,重要性已經(jīng)等同于英偉達(dá)的GPU了。

谷歌本身作為在AI算法和大模型上耕耘了諸多時(shí)間的巨頭,從設(shè)計(jì)芯片之初就知道他們需要何種計(jì)算資源,正因如此,TPU幾乎將所有的面積都分給了低精度的張量計(jì)算單元。這種ASIC方案也讓谷歌大幅降低了打造AI Hypercomputer的成本。

但谷歌作為云服務(wù)廠商巨頭還是逃不開通用性的問題,谷歌的TPU更多是為Gemini的模型做了優(yōu)化,盡管TPU支持PyTorch、Tensorflow等常見AI模型,但在追求極致性能的選擇上,還是難以媲美GPU。正因如此,在谷歌和其他大模型開發(fā)者的眼中,TPU固然性能不弱,但更像是一個(gè)性價(jià)比之選。用于已經(jīng)成功商業(yè)化模型的降本增效屬于不錯(cuò)的選擇,但如果想要在這個(gè)競爭激烈的大模型市場殺出重圍,那就只有谷歌能將TPU物盡其用。

在不少AI芯片廠商的宣傳中,為了抬高自己的專用產(chǎn)品定位,將英偉達(dá)的GPU還是定性為圖形處理單元??稍贖100這種規(guī)模的GPU上,無論是性能和能效,也毫不輸某些專用開發(fā)環(huán)境下的ASIC,至于未來更復(fù)雜的圖形處理,英偉達(dá)也推出了L4 GPU這樣的對應(yīng)方案。

在今年GTC上,谷歌的云服務(wù)部門也宣布和英偉達(dá)達(dá)成深度合作關(guān)系,通過英偉達(dá)的H100和L4 GPU支持使用其云服務(wù)的AI開發(fā)者。同時(shí)谷歌也將購置GB200 NVL72系統(tǒng),基于谷歌云的A3實(shí)例為開發(fā)者提供DGX Cloud的云端LLM托管方案,這也是對現(xiàn)有H100機(jī)器的升級。除此之外,就連谷歌自己的JAX框架,也在雙方的合作之下,在英偉達(dá)的GPU上得到了支持。可以看出,谷歌還是采取兩手抓的策略,TPU和GPU一并重要。

全力追逐Scaling Laws的大廠們

對于AI大模型而言,模型大小、數(shù)據(jù)集大小和計(jì)算成本之間不僅組成了三元關(guān)系,也代表了模型性能。而Scaling Laws這一擴(kuò)展法則定義了三者之間勢必會存在某種比例擴(kuò)展,只不過如今看來,其邊際效應(yīng)已經(jīng)變得越來越大。以GPT為例,如果GPT-6繼續(xù)按照這樣的比例擴(kuò)展下去,且不說性能提升有限,即便微軟這樣的商業(yè)巨頭也很難撐起成本的劇增。

可就是這樣微不可察的差距,甚至對于AI大模型的常見應(yīng)用聊天機(jī)器人來說只是速度和精度上的一些差距,卻決定了他們在之后的十幾年里能否繼續(xù)制霸下去。微軟作為已經(jīng)在操作系統(tǒng)上實(shí)現(xiàn)霸權(quán)地位的廠商,自然也明白先入為主的重要性。

在邊際效應(yīng)的影響下,即便后入局的巨頭,也有不少迎頭趕上的機(jī)會,比如近期傳出正在秘密研發(fā)Metis聊天機(jī)器人的亞馬遜。亞馬遜同樣擁有自研服務(wù)器芯片的技術(shù)積累,但主要優(yōu)勢還是在CPU上,AI加速器相關(guān)的產(chǎn)品(Inferentia和Trainium)依舊有比較大的改進(jìn)空間,而且與亞馬遜自己的業(yè)務(wù)還沒有緊密結(jié)合起來。如果亞馬遜愿意去打造這樣一個(gè)聊天機(jī)器人應(yīng)用,很有可能后續(xù)也會加強(qiáng)在GPU上的投入,而不再緊緊作為云托管方案。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5102

    瀏覽量

    134487
  • AI
    AI
    +關(guān)注

    關(guān)注

    90

    文章

    38225

    瀏覽量

    297121
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    華為發(fā)布AI容器技術(shù)Flex:ai,力平均利用率提升30%

    決方案。 ? 當(dāng)前,AI產(chǎn)業(yè)正處于高速發(fā)展的黃金時(shí)期,海量力需求如潮水般涌來。然而,力資源利用率偏低的問題卻成為了產(chǎn)業(yè)發(fā)展的關(guān)鍵桎梏。具體表現(xiàn)為,小模型任務(wù)常常獨(dú)占整,導(dǎo)致大量資
    的頭像 發(fā)表于 11-26 08:31 ?7209次閱讀

    640節(jié)點(diǎn)問世:國產(chǎn)力實(shí)現(xiàn)關(guān)鍵一躍

    單機(jī)柜級640節(jié)點(diǎn)ScaleX640,為如火如荼的力競爭注入了新的變量。 ? 這款被命名為ScaleX640的節(jié)點(diǎn),憑借“一拖二”高密架構(gòu)和單機(jī)柜640
    的頭像 發(fā)表于 11-11 09:26 ?1963次閱讀

    節(jié)點(diǎn)+集群”:華為撞出來的力之路

    節(jié)點(diǎn)+集群”,成為徹底解決AI力困局的契機(jī)
    的頭像 發(fā)表于 09-24 10:55 ?846次閱讀
    “<b class='flag-5'>超</b>節(jié)點(diǎn)+集群”:華為撞出來的<b class='flag-5'>算</b>力之路

    力與電力的終極博弈,填上了AIDC的“電力黑洞

    ),專注于提供人工智能訓(xùn)練與推理所需的力服務(wù)、數(shù)據(jù)服務(wù)和算法服務(wù)。AIDC采用異構(gòu)計(jì)算架構(gòu),結(jié)合GPU、FPGA、ASIC等多種AI加速芯片,形成高并發(fā)分布式系統(tǒng),以滿足大模型訓(xùn)練和推理的極高
    的頭像 發(fā)表于 09-22 02:43 ?7413次閱讀

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI的未來:提升力還是智力

    本章節(jié)作者分析AI的未來在哪里,就目前而言有來那個(gè)兩種思想:①繼續(xù)增加大模型②將大模型改為小模型,并將之優(yōu)化使之與大模型性能不不相上下。 一、大模型是一條不可持續(xù)發(fā)展的道路 大模型的不可
    發(fā)表于 09-14 14:04

    睿海光電領(lǐng)航AI光模塊:快交付與全場景兼容賦能智時(shí)代——以創(chuàng)新實(shí)力助力全球客戶構(gòu)建高效力底座

    深圳、北京、香港三大運(yùn)營中心,提供本地化技術(shù)服務(wù)網(wǎng)絡(luò)。公司首創(chuàng)“三年質(zhì)保、終身維修”政策,累計(jì)服務(wù)全球1560余家客戶,涵蓋頭部云廠商、電信運(yùn)營商及中心。2025年初,睿海光電更推出AI智能診斷
    發(fā)表于 08-13 19:03

    aicube的ngpu索引該如何添加?

    請問有人知道aicube怎樣才能讀取ngpu索引呢,我已經(jīng)安裝了cuda和cudnn,在全局的py里添加了torch,能夠調(diào)用gpu,當(dāng)還是只能看到默認(rèn)的gpu0,顯示不了
    發(fā)表于 07-25 08:18

    【「力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】+NVlink技術(shù)從應(yīng)用到原理

    自家GPU 提出的多力互連技術(shù),是早期為了應(yīng)對深度學(xué)習(xí)對超高力需求而單卡力不足的局面的解決方案,當(dāng)然這都是官方用來吹牛的話術(shù)。我自己
    發(fā)表于 06-18 19:31

    加速是什么東西?它真能在AI戰(zhàn)場上干掉GPU和TPU!

    隨著AI技術(shù)火得一塌糊涂,大家都在談"大模型"、"AI加速"、"智能計(jì)算",可真到了落地環(huán)節(jié),力才是硬通貨。你有沒有發(fā)現(xiàn),現(xiàn)在越來越多的AI企業(yè)不光用
    的頭像 發(fā)表于 06-05 13:39 ?1319次閱讀
    智<b class='flag-5'>算</b>加速<b class='flag-5'>卡</b>是什么東西?它真能在<b class='flag-5'>AI</b>戰(zhàn)場上干掉<b class='flag-5'>GPU</b>和TPU!

    DeepSeek推動(dòng)AI力需求:800G光模塊的關(guān)鍵作用

    數(shù)據(jù)傳輸速率,減少帶寬瓶頸,成為數(shù)據(jù)中心和AI集群架構(gòu)優(yōu)化的重點(diǎn)。光模塊速率的躍升不僅提升了傳輸效率,也為大規(guī)模并行計(jì)算任務(wù)提供必要的帶寬保障。 800G光模塊如何解決DeepSeek大規(guī)模
    發(fā)表于 03-25 12:00

    力破局:科通技術(shù)以&quot;AI大模型+AI芯片&quot;重構(gòu)智底座

    “科通技術(shù)”)推出的“DeepSeek+AI芯片”全場景方案,在云AI領(lǐng)域取得重大突破。除了GPU力總量,云AI的一大挑戰(zhàn)來源于
    的頭像 發(fā)表于 03-17 11:14 ?714次閱讀

    國家平臺推出AI生態(tài)加速計(jì)劃

    向有需求的企業(yè)免費(fèi)開放為期三個(gè)月的DeepSeek API接口使用權(quán)。DeepSeek作為國家互聯(lián)網(wǎng)平臺的重要技術(shù)成果,其滿血版模型鏡像已正式上線,并將通過API接口的形式,為企業(yè)提供強(qiáng)大的AI計(jì)算能力。 此外,該計(jì)劃還包括
    的頭像 發(fā)表于 02-14 09:16 ?693次閱讀

    GPU力租用平臺有什么好處

    當(dāng)今,GPU力租用平臺為科研機(jī)構(gòu)、企業(yè)乃至個(gè)人開發(fā)者提供靈活高效的力解決方案。下面,AI部落小編帶您深入探討
    的頭像 發(fā)表于 02-07 10:39 ?727次閱讀

    融合 南京信易達(dá)發(fā)布全新“智能力融合平臺”

    1月7日,南京信易達(dá)發(fā)布旗下最新力平臺“C-MOM智能力融合平臺V3.0”,并更新全新的UI視覺與交互系統(tǒng)。 該平臺集成了HPC
    的頭像 發(fā)表于 01-08 10:56 ?1283次閱讀
    <b class='flag-5'>超</b><b class='flag-5'>算</b>智<b class='flag-5'>算</b>融合 南京信易達(dá)發(fā)布全新“智能<b class='flag-5'>算</b>力融合平臺”

    小米加速布局AI大模型,搭建GPU集群

    近日,有消息稱小米正在緊鑼密鼓地搭建自己的GPU集群,旨在加大對AI大模型的投入力度。據(jù)悉,小米的大模型團(tuán)隊(duì)在成立之初就已經(jīng)擁有6500張GP
    的頭像 發(fā)表于 12-28 14:25 ?794次閱讀