chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌采用全新AI架構(gòu),晶體管性能得到巨幅提升

獨(dú)愛72H ? 來源:機(jī)器之心Pro ? 作者:機(jī)器之心Pro ? 2019-11-20 15:25 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

(文章來源:機(jī)器之心Pro)

TSP 的全稱是 Tensor Streaming Processor,專為機(jī)器學(xué)習(xí)AI 相關(guān)需求打造。該架構(gòu)在單塊芯片上可以實(shí)現(xiàn)每秒 1000 萬億(10 的 15 次方)次運(yùn)算,是全球首個實(shí)現(xiàn)該級別性能的架構(gòu),其浮點(diǎn)運(yùn)算性能可達(dá)每秒 250 萬億次(TFLOPS)。在摩爾定律走向消亡的背景下,這一架構(gòu)的問世標(biāo)志著芯片之爭從晶體管轉(zhuǎn)向架構(gòu)。

250 TFLOPS 浮點(diǎn)運(yùn)算性能是什么概念?目前的世界第一超級計算機(jī) Summit,其峰值算力為 200,794.9 TFLOPS,它的背后是 28,000 塊英偉達(dá) Volta GPU。如果 TSP 達(dá)到了類似的效率,僅需 803 塊就可以實(shí)現(xiàn)同樣的性能。Groq 在一份白皮書中介紹了這項(xiàng)全新的架構(gòu)設(shè)計。此外,他們還將在于美國丹佛舉辦的第 23 屆國際超算高峰論壇上展示這一成果。

我們?yōu)檫@一行業(yè)和我們的客戶感到興奮,Groq 的聯(lián)合創(chuàng)始人和 CEO Jonathan Ross 表示。頂級 GPU 公司都在宣稱他們有望在未來幾年向用戶交付一款每秒百萬億次運(yùn)算性能的產(chǎn)品,但 Groq 現(xiàn)在就做到了,而且建立了一個新的性能標(biāo)準(zhǔn)。就低延遲和推理速度而言,Groq 的架構(gòu)比其他任何用于推理的架構(gòu)都要快許多倍。我們與用戶的互動證明了這一點(diǎn)。

Groq 的 TSP 架構(gòu)是專為計算機(jī)視覺、機(jī)器學(xué)習(xí)和其他 AI 相關(guān)工作負(fù)載的性能要求設(shè)計的。對于一大批需要深度學(xué)習(xí)推理運(yùn)算的應(yīng)用來說,Groq 的解決方案是非常理想的選擇,Groq 的首席架構(gòu)師 Dennis Abts 表示,但除此之外,Groq 的架構(gòu)還能用于廣泛的工作負(fù)載。它的性能和簡潔性使其成為所有高性能即數(shù)據(jù)和計算密集型工作復(fù)雜的理想平臺。

Groq 的這款架構(gòu)受到軟件優(yōu)先(software first)理念的啟發(fā)。它在 Groq 開發(fā)的 TSP 中實(shí)現(xiàn),為實(shí)現(xiàn)計算靈活性和大規(guī)模并行計算提供了一種新的范式,但沒有傳統(tǒng) GPU 和 CPU 架構(gòu)的限制和溝通開銷。在 Groq 的架構(gòu)中,Groq 編譯器負(fù)責(zé)編碼所有內(nèi)容:數(shù)據(jù)流入芯片,并在正確的時間和正確的地點(diǎn)插入,以確保計算實(shí)時進(jìn)行,沒有停頓。執(zhí)行規(guī)劃由軟件負(fù)責(zé),這樣就可以釋放出原本要用于動態(tài)指令執(zhí)行的寶貴硬件資源。

在傳統(tǒng)的體系架構(gòu)中,將數(shù)據(jù)從 DRAM 移動到處理器需要大量的算力和時間,而且相同工作負(fù)載上的處理性能也是可變的。在典型的工作流中,開發(fā)人員通過反復(fù)運(yùn)行工作負(fù)載或程序來對其進(jìn)行配置和測試,以驗(yàn)證和度量其平均處理性能。由于處理器接收和發(fā)送數(shù)據(jù)的方式不同,這種處理可能會得到略有差別的結(jié)果,而開發(fā)人員的工作就是手動調(diào)整程序以達(dá)到預(yù)定的可靠性級別。

但有了 Groq 的硬件和軟件,編譯器就可以準(zhǔn)確地知道芯片的工作方式以及執(zhí)行每個計算所需的時間。編譯器在正確的時間將數(shù)據(jù)和指令移動到正確的位置,這樣就不會有延遲。到達(dá)硬件的指令流是完全編排好的,使得處理速度更快,而且可預(yù)測。開發(fā)人員可以在 Groq 芯片上運(yùn)行相同的模型 100 次,每次得到的結(jié)果都完全相同。對于安全和準(zhǔn)確性要求都非常高的應(yīng)用來說(如自動駕駛汽車),這種計算上的準(zhǔn)確性至關(guān)重要。

另外,使用 Groq 硬件設(shè)計的系統(tǒng)不會受到長尾延遲的影響,AI 系統(tǒng)可以在特定的功率或延遲預(yù)算內(nèi)進(jìn)行調(diào)整。這種軟件優(yōu)先的設(shè)計(即編譯器決定硬件架構(gòu))理念幫助 Groq 設(shè)計出了一款簡單、高性能的架構(gòu),可以加速推理流程。該架構(gòu)既支持傳統(tǒng)的機(jī)器學(xué)習(xí)模型,也支持新的計算學(xué)習(xí)模型,目前在 x86 和非 x86 系統(tǒng)的客戶站點(diǎn)上運(yùn)行。

為了滿足深度學(xué)習(xí)等計算密集型任務(wù)的需求,芯片的設(shè)計似乎正在變得越來越復(fù)雜。但 Groq 認(rèn)為,這種趨勢從根本上就是錯誤的。他們在白皮書中指出,當(dāng)前處理器架構(gòu)的復(fù)雜性已經(jīng)成為阻礙開發(fā)者生產(chǎn)和 AI 應(yīng)用部署的主要障礙。當(dāng)前處理器的復(fù)雜性降低了開發(fā)者工作效率,再加上摩爾定律逐漸變慢,實(shí)現(xiàn)更高的計算性能變得越來越困難。

Groq 的芯片設(shè)計降低了傳統(tǒng)硬件開發(fā)的復(fù)雜度,因此開發(fā)者可以更加專注于算法(或解決其他問題),而不是為了硬件調(diào)整自己的解決方案。有了這種更加簡單的硬件設(shè)計,開發(fā)者無需進(jìn)行剖析研究(profiling),因此可以節(jié)省資源,更容易大規(guī)模部署 AI 應(yīng)用。與基于 CPU、GPU 和 FPGA 的傳統(tǒng)復(fù)雜架構(gòu)相比,Groq 的芯片還簡化了認(rèn)證和部署,使客戶能夠簡單而快速地實(shí)現(xiàn)可擴(kuò)展、單瓦高性能的系統(tǒng)。

Groq 的張量流架構(gòu)可以在任何需要的地方提供算力。與當(dāng)前領(lǐng)先的 GPU、CPU 相比,Groq 處理器的每個晶體管可以實(shí)現(xiàn) 3-6 倍的性能提升。這一改進(jìn)意味著交付性能的提升、延遲的下降以及成本的降低。結(jié)果是,Groq 的架構(gòu)使用起來更加簡單,而且性能高于傳統(tǒng)計算平臺。
(責(zé)任編輯:fqj)

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6244

    瀏覽量

    110213
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    2060

    瀏覽量

    36549
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    多值電場型電壓選擇晶體管結(jié)構(gòu)

    多值電場型電壓選擇晶體管結(jié)構(gòu) 為滿足多進(jìn)制邏輯運(yùn)算的需要,設(shè)計了一款多值電場型電壓選擇晶體管??刂贫M(jìn)制電路通斷需要二進(jìn)制邏輯門電路,實(shí)際上是對電壓的一種選擇,而傳統(tǒng)二進(jìn)制邏輯門電路通常比較復(fù)雜
    發(fā)表于 09-15 15:31

    Nexperia推出采用銅夾片封裝的雙極性晶體管

    的新產(chǎn)品旨在滿足工業(yè)與汽車領(lǐng)域?qū)Ω吖β市?、更具成本?yōu)勢設(shè)計方案的持續(xù)需求。與傳統(tǒng)DPAK封裝的MJD晶體管相比,采用CFP15B封裝的MJPE系列產(chǎn)品在保證性能不受影響的前提下,能顯著節(jié)省電路板空間并帶來成本優(yōu)勢。
    的頭像 發(fā)表于 07-18 14:19 ?2218次閱讀

    晶體管架構(gòu)的演變過程

    芯片制程從微米級進(jìn)入2納米時代,晶體管架構(gòu)經(jīng)歷了從 Planar FET 到 MBCFET的四次關(guān)鍵演變。這不僅僅是形狀的變化,更是一次次對物理極限的挑戰(zhàn)。從平面晶體管到MBCFET,每一次
    的頭像 發(fā)表于 07-08 16:28 ?1862次閱讀
    <b class='flag-5'>晶體管</b><b class='flag-5'>架構(gòu)</b>的演變過程

    下一代高速芯片晶體管解制造問題解決了!

    提高了器件的性能。據(jù)IMEC的研究,叉片晶體管相比納米片晶體管可以實(shí)現(xiàn)約10%的性能提升。 叉片晶體管
    發(fā)表于 06-20 10:40

    薄膜晶體管技術(shù)架構(gòu)與主流工藝路線

    導(dǎo)語薄膜晶體管(TFT)作為平板顯示技術(shù)的核心驅(qū)動元件,通過材料創(chuàng)新與工藝優(yōu)化,實(shí)現(xiàn)了從傳統(tǒng)非晶硅向氧化物半導(dǎo)體、柔性電子的技術(shù)跨越。本文將聚焦于薄膜晶體管制造技術(shù)與前沿發(fā)展。
    的頭像 發(fā)表于 05-27 09:51 ?2268次閱讀
    薄膜<b class='flag-5'>晶體管</b>技術(shù)<b class='flag-5'>架構(gòu)</b>與主流工藝路線

    寬帶隙WBG功率晶體管性能測試與挑戰(zhàn)

    晶體管性能得到了顯著提升,開啟了更高效率和更快動態(tài)響應(yīng)的可能性。寬帶隙晶體管在現(xiàn)代電力系統(tǒng)中扮演著關(guān)鍵角色,包括開關(guān)電源(SMPS)、逆變
    的頭像 發(fā)表于 04-23 11:36 ?720次閱讀
    寬帶隙WBG功率<b class='flag-5'>晶體管</b>的<b class='flag-5'>性能</b>測試與挑戰(zhàn)

    多值電場型電壓選擇晶體管結(jié)構(gòu)

    多值電場型電壓選擇晶體管結(jié)構(gòu) 為滿足多進(jìn)制邏輯運(yùn)算的需要,設(shè)計了一款多值電場型電壓選擇晶體管??刂贫M(jìn)制電路通斷需要二進(jìn)制邏輯門電路,實(shí)際上是對電壓的一種選擇,而傳統(tǒng)二進(jìn)制邏輯門電路通常比較復(fù)雜
    發(fā)表于 04-15 10:24

    晶體管電路設(shè)計(下)

    晶體管,F(xiàn)ET和IC,F(xiàn)ET放大電路的工作原理,源極接地放大電路的設(shè)計,源極跟隨器電路設(shè)計,F(xiàn)ET低頻功率放大器的設(shè)計與制作,柵極接地放大電路的設(shè)計,電流反饋型OP放大器的設(shè)計與制作,進(jìn)晶體管
    發(fā)表于 04-14 17:24

    晶體管電路設(shè)計(下) [日 鈴木雅臣]

    本書主要介紹了晶體管,F(xiàn)ET和Ic,F(xiàn)ET放大電路的工作原理,源極接地放大電路的設(shè)計,源極跟隨電路的設(shè)計,F(xiàn)ET低頻功率放大器的設(shè)計和制作,柵極接地放大電路的設(shè)計,電流反饋行型op放大器的設(shè)計與制作
    發(fā)表于 03-07 13:55

    晶體管電路設(shè)計與制作

    這本書介紹了晶體管的基本特性,單電路的設(shè)計與制作, 雙管電路的設(shè)計與制作,3~5電路的設(shè)計與制作,6以上電路的設(shè)計與制作。書中具體內(nèi)容有:直流工作解析,交流工作解析,接地形式,單
    發(fā)表于 02-26 19:55

    互補(bǔ)場效應(yīng)晶體管的結(jié)構(gòu)和作用

    , Gate-all-Around)全環(huán)繞柵極晶體管(GAAFET)等先進(jìn)結(jié)構(gòu),在減少漏電、降低功耗方面雖然取得了顯著成就,但進(jìn)一步微縮的挑戰(zhàn)日益顯現(xiàn)。為了延續(xù)摩爾定律的發(fā)展趨勢,并滿足未來高性能計算的需求,業(yè)界正積極研發(fā)下一代晶體管
    的頭像 發(fā)表于 01-24 10:03 ?4196次閱讀
    互補(bǔ)場效應(yīng)<b class='flag-5'>晶體管</b>的結(jié)構(gòu)和作用

    如何測試晶體管性能 常見晶體管品牌及其優(yōu)勢比較

    如何測試晶體管性能 晶體管是電子電路中的基本組件,其性能測試對于確保電路的可靠性和穩(wěn)定性至關(guān)重要。以下是測試晶體管
    的頭像 發(fā)表于 12-03 09:52 ?1816次閱讀

    晶體管電流放大器的原理 晶體管在功放電路中的應(yīng)用實(shí)例

    晶體管電流放大器的原理 晶體管是一種半導(dǎo)體器件,能夠?qū)﹄娏鬟M(jìn)行控制和放大。晶體管的工作原理基于半導(dǎo)體材料的PN結(jié)特性。PN結(jié)由P型半導(dǎo)體和N型半導(dǎo)體組成,它們在接觸時形成一個勢壘,阻止電流通過。當(dāng)在
    的頭像 發(fā)表于 12-03 09:50 ?3259次閱讀

    晶體管故障診斷與維修技巧 晶體管在數(shù)字電路中的作用

    晶體管是現(xiàn)代電子設(shè)備中不可或缺的組件,它們在數(shù)字電路中扮演著至關(guān)重要的角色。了解如何診斷和維修晶體管故障對于電子工程師和技術(shù)人員來說是一項(xiàng)基本技能。 一、晶體管在數(shù)字電路中的作用 開關(guān)功能 :
    的頭像 發(fā)表于 12-03 09:46 ?2185次閱讀

    晶體管與場效應(yīng)的區(qū)別 晶體管的封裝類型及其特點(diǎn)

    晶體管與場效應(yīng)的區(qū)別 工作原理 : 晶體管晶體管(BJT)基于雙極型晶體管的原理,即通過控制基極電流來控制集電極和發(fā)射極之間的電流。
    的頭像 發(fā)表于 12-03 09:42 ?1591次閱讀