chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

淺析移動GPU廠商的發(fā)展史及其核心技術

SSDFans ? 來源:未知 ? 作者:胡薇 ? 2018-09-13 09:55 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

人工智能的飛速發(fā)展,需要強大的算力作為支撐,這背后NIVIDIA可謂是當之無愧的功臣。NIVIDIA先進的GPU技術和優(yōu)異的軟件生態(tài),使其在競爭中脫穎而出,成為市場霸主。目前人工智能在圖像處理及語音識別領域的研究取得了很好的發(fā)展,在手機和安防領域也有很多產品落地。在落地過程中,依然會面臨設備算力的問題,而移動端GPU則自然而然的進入了人們的視野。

移動端GPU廠商的發(fā)展史

在移動端GPU市場中,沒有形成一家獨大的競爭格局。目前主要的移動端GPU廠商有高通,arm和imaginaton。高通的adreno來自ATI的imageon,ATI最早被AMD收購,后來高通收購了AMD的移動設備資產,取得了AMD的矢量繪圖與3D繪圖技術和相關知識產權。后來高通結合AMD的手機圖形技術發(fā)展為自家的Adreno圖形處理器。另一家移動計算的巨頭ARM,ARM在移動CPU的市場地位可謂遙不可及,但是在GPU領域,它確是諸多廠商中的一家,他的GPU業(yè)務也并非一開始就擁有,而是后來組建的。其GPU技術來自一家名為Falanx的公司,這家公司是早起從挪威大學脫離出來的一個名為mali的研究小組的成員組建的,最早定位于PC領域,失利后轉向SoC GPU設計。隨著SoC市場的不斷壯大,以及移動計算的發(fā)展,ARM收購了Falanx,組建了自己的GPU事業(yè)部。最后一家,Imagination Technologies,這是一家專注于GPU技術的公司,最早在桌面級GPU的競爭中失利,后來轉戰(zhàn)移動端,Intel,三星,蘋果,聯發(fā)科,展訊曾經都是他的客戶,一度被認為是全球最大的移動GPU廠商。這家公司可謂命運多舛,曾經作為蘋果的供應商,由于iphone的每代產品在圖形性能方面都比arm公版的Mali GPU有優(yōu)勢,一度讓Imagination風光無二,但是隨著蘋果宣布自研GPU,Imagination的股票出現了斷崖式下跌,公司瀕臨破產。后來將其業(yè)務進行拆分,MIPS業(yè)務出售給Tallwood MIPS,而GPU業(yè)務則出售給中國背景的私募基金Canyon Bridge。這一收購也填補了國內在GPU領域的空白。

在市場占有率方面,由于ARM以及高通的捆綁銷售,Imagination并無優(yōu)勢,但是鑒于在物聯網以及人工智能領域,目前三家都還沒有建立起強大的生態(tài),因此未來誰能稱雄并未可知。

在技術方面三家GPU廠商架構差異比較明顯,而且對外披露都比較少,相比較來說Imagination發(fā)面對于技術方面會開放一些。

Imagination的GPU Rogue架構淺析

在關于GPU的宣傳中很容易看到一個詞core,而且高端GPU也都是成千上萬的core。其實宣傳中的core并非CPU上“核”的概念。而真正意義上的核心,應該是AMD GCN架構中的Compute Unit, NVIDIA Maxwell架構中的SMM以及PowerVR Rogue架構中的USC等。對應于編程語言,應該是OpenCL中的Compute Unit(簡稱CU)。而宣傳中所謂的core,則是OpenCL中的ProcessElement(簡稱PE)。

目前GPU采用的是多層級的線程技術,硬件結構和軟件概念的對照如下圖所示:從硬件結構看,首先是GPU設備,叫做device;一個GPU包含多個CU,而每個CU又包含多個計算通道。從OpenCL的軟件架構看,每個NDRange對應一個GPU設備,其包含多個work-group,而每個work-group必須在一個CU上執(zhí)行,也就是說,每個CU可以執(zhí)行多個work-group,但是每個work-group不可以拆分到多個CU上去執(zhí)行;每個work-group包含多個work-item,一個計算通道執(zhí)行一個work-item。

簡單介紹一下計算通道,SIMD叫做單指令多數據流(Single instruction MultipleData),目前所有的GPU都術語SIMD,一般都是16路或者32路SIMD。

關于線程的調度,首先介紹一個概念,AMD的wavefront或者NIVIDIA的warp,這是指線程調度的最小單位,也就是說,在GPU中每次執(zhí)行一個warp,一般一個warp包含32個線程;對于AMD顯卡則是一個wavefront包含64個work-item。下文中對這一概念統稱為warp,線程和work-item通用。在Rogue架構中每個warp也是包含32個線程。

如下圖所示,是Rogue架構的示意圖,GPU中包含有多個USC(個數與產品型號有關),每個USC包含著色器,駐留槽,執(zhí)行單元,存儲器,紋理單元等等等。這樣每個work-item在自己的生命周期中都包含自己的片上存儲在Unified store中,shared local memory隱藏在common store中,這樣每個USC都可以在warp之間進行零開銷的上下文切換。

線程的執(zhí)行過程如下圖:

圖中的Residency Slots中包含很多slot,每個slot代表一個warp,空的表示目前還沒有部署warp。而部署了warp的slots一共有三個狀態(tài),綠色表示active,黃色表示ready,可以執(zhí)行了,紅色表示阻塞;active的warp接下來會在執(zhí)行單元上執(zhí)行,如圖右側所示,所有的32個work-item同時并行執(zhí)行。Ready的會在下一個執(zhí)行周期被調度執(zhí)行;阻塞的則是因為讀寫等原因進入該狀態(tài)。

下圖是USC中流水線示意圖,其中包含4個warp的調度。Warp0首先被執(zhí)行,warp0會一直執(zhí)行到它進入阻塞狀態(tài),例如讀寫全局存儲,此時調度器會停止調度warp0,開始執(zhí)行warp1;因為warp中的所有工作項執(zhí)行相同的kernel代碼,因此就有相同的特性,例如同時進入阻塞;在warp2進入阻塞狀態(tài)時,warp0讀寫結束,進入read狀態(tài);最后在調度器調度完warp3后,重新開始調度warp0。這樣并發(fā)執(zhí)行可以實現對內存訪問延遲的隱藏。因此在編程實現中一般使用較大的工作組,來實現warp切換對內存訪問的延遲(當然,這不是絕對的,在實際中還要考慮寄存器等資源的消耗情況)。

下圖展示了Rogue架構下得PowerVR Series7XT系列的架構圖。

該系列的GPU擁有2到16個USC,因此具有100GFLOPS到1.5TFLOPS的可擴展性能。如下圖展示了該系列GPU的USC架構。

以GT7400為例,其擁有128個FP32ALU核心,256個FP16 ALU核心。每個USC中包含16個pipelines,每個pipelines中含有多個ALU。其中的SFU可以原生的處理FP16、FP32(上一代會全部推給FP32),因此這一代架構可以避免沒有必要的高精度操作,提升了性能并降低了功耗。

目前Imagenition已經發(fā)布了最新的GPU架構Furian,該架構相對于多年來已成業(yè)界標桿的Rogue架構有了在性能方面有了更大的提升。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5039

    瀏覽量

    133850
  • 人工智能
    +關注

    關注

    1811

    文章

    49507

    瀏覽量

    258455

原文標題:移動GPU淺談

文章出處:【微信號:SSDFans,微信公眾號:SSDFans】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    深入解析X-Ray設備檢測的核心技術與應用價值-智誠精展

    在現代工業(yè)、安檢和材料檢測領域,X-Ray設備的應用日益廣泛。然而,許多人對X-Ray設備的核心技術、檢測原理及其實際應用仍存在疑問。如,X-Ray設備是如何工作的?它們在各個行業(yè)中究竟有什么樣
    的頭像 發(fā)表于 10-16 13:42 ?63次閱讀

    便攜式高光譜相機的核心技術與應用優(yōu)勢

    光譜相機憑借其獨特的核心技術和廣泛的應用場景,成為了農業(yè)監(jiān)測、環(huán)境評估、材料分析等領域的重要解決方案。本文將深入解析便攜式高光譜相機的核心技術和其帶來的諸多應用優(yōu)勢,助您更好地理解這一領域的最新發(fā)展。 1. 什么
    的頭像 發(fā)表于 09-05 15:39 ?430次閱讀
    便攜式高光譜相機的<b class='flag-5'>核心技術</b>與應用優(yōu)勢

    深入解析地物光譜儀廠家核心技術與行業(yè)優(yōu)勢

    高精度、多波段覆蓋及穩(wěn)定性能的地物光譜儀,以滿足復雜地物分析需求?本文將深入探討地物光譜儀廠家在核心技術上的突破及其帶來的行業(yè)優(yōu)勢,幫助您更好地理解選擇優(yōu)質設備的關鍵因素。 地物光譜儀核心技術解析 地物光譜儀是一種
    的頭像 發(fā)表于 08-28 09:46 ?300次閱讀

    Kubernetes安全加固的核心技術

    在生產環(huán)境中,Kubernetes集群的安全性直接關系到企業(yè)數據安全和業(yè)務穩(wěn)定性。本文將從實戰(zhàn)角度,帶你掌握K8s安全加固的核心技術
    的頭像 發(fā)表于 08-18 11:18 ?343次閱讀

    聊聊倒裝芯片凸點(Bump)制作的發(fā)展史

    凸點(Bump)是倒裝芯片的“神經末梢”,其從金凸點到Cu-Cu鍵合的演變,推動了芯片從平面互連向3D集成的跨越。未來,隨著間距縮小至亞微米級、材料與工藝的深度創(chuàng)新,凸點將成為支撐異構集成、高帶寬芯片的核心技術,在AI、5G、汽車電子等領域發(fā)揮關鍵作用。
    的頭像 發(fā)表于 08-12 09:17 ?2199次閱讀
    聊聊倒裝芯片凸點(Bump)制作的<b class='flag-5'>發(fā)展史</b>

    【「DeepSeek 核心技術揭秘」閱讀體驗】+混合專家

    感謝電子發(fā)燒友提供學習Deepseek核心技術這本書的機會。 讀完《Deepseek核心技術揭秘》,我深受觸動,對人工智能領域有了全新的認識。了解Deepseek-R1 、Deepseek-V3
    發(fā)表于 07-22 22:14

    深圳 SMT:現代電子制造的核心技術

    深圳 SMT 作為現代電子制造的核心技術,在過去的發(fā)展中取得了輝煌成就,在未來也將繼續(xù)引領電子制造行業(yè)的發(fā)展潮流,為全球電子產品的創(chuàng)新和升級提供堅實的技術支撐。而晉力達回流焊設備也將憑
    的頭像 發(fā)表于 06-23 14:17 ?882次閱讀

    工業(yè)物聯網的核心技術是什么

    工業(yè)物聯網(IIoT)的核心技術是實現工業(yè)設備互聯、數據采集、傳輸、處理與應用的關鍵,以下從設備連接、數據采集、通信傳輸、數據處理與分析、安全保障五個維度展開介紹: 設備連接技術 傳感器技術
    的頭像 發(fā)表于 06-12 09:34 ?566次閱讀

    【書籍評測活動NO.62】一本書讀懂 DeepSeek 全家桶核心技術:DeepSeek 核心技術揭秘

    的展望,大模型的訓練方法、推理部署,到 GPU 硬件及推理模型的發(fā)展趨勢,以前瞻性的視角為讀者描繪了大模型的發(fā)展藍圖。 DeepSeek核心+配套視頻課程 本書由一線資深
    發(fā)表于 06-09 14:38

    半導體材料發(fā)展史:從硅基到超寬禁帶半導體的跨越

    半導體材料是現代信息技術的基石,其發(fā)展史不僅是科技進步的縮影,更是人類對材料性能極限不斷突破的見證。從第一代硅基材料到第四代超寬禁帶半導體,每一代材料的迭代都推動了電子器件性能的飛躍。 1 第一代
    的頭像 發(fā)表于 04-10 15:58 ?1853次閱讀

    深入探討DeepSeek大模型的核心技術

    導讀 本文深入探討了DeepSeek大模型的核心技術,從公司背景、模型能力、訓推成本到核心技術細節(jié)進行了全面分析。 ? 一、關于DeepSeek公司及其大模型 1.1 公司概況 DeepSeek
    的頭像 發(fā)表于 02-10 10:49 ?2941次閱讀
    深入探討DeepSeek大模型的<b class='flag-5'>核心技術</b>

    移動機器人核心科技解碼:導航、感知與掌控力的深度剖析

    富唯智能移動機器人的核心技術主要包括導航、感知與控制。這些技術共同決定了移動機器人在不同環(huán)境中的自主行動能力和工作效率。
    的頭像 發(fā)表于 01-02 16:01 ?721次閱讀

    從市場角度解讀機器人核心關鍵技術

    從講機器人發(fā)展史--機器人技術層面上升到從場景從市場來談人工智能機器人核心關鍵技術的階段了。對于人工智能機器人來說,若從技術角度來討論
    的頭像 發(fā)表于 12-25 15:20 ?1045次閱讀
    從市場角度解讀機器人<b class='flag-5'>核心</b>關鍵<b class='flag-5'>技術</b>

    從MCU到SoC:汽車芯片核心技術的深度剖析

    在科技日新月異的今天,汽車已經從單純的交通工具演變?yōu)榧悄芑⒕W聯化、電動化于一體的高科技產品。這一變革的背后,汽車芯片作為汽車電子系統的核心組成部分,發(fā)揮著至關重要的作用。本文將深入探討汽車芯片產業(yè)鏈及其關鍵核心技術,揭示這一
    的頭像 發(fā)表于 12-20 13:40 ?2283次閱讀
    從MCU到SoC:汽車芯片<b class='flag-5'>核心技術</b>的深度剖析

    淺談顯示屏的發(fā)展史

    顯示器如今已成為日常辦公、娛樂不可或缺的一部分,它是人們與機器之間交互的窗口,隨著顯示器技術的不斷發(fā)展,也讓人機交互體驗提升了一個又一個新的臺階,時至今日,歷經超100年的發(fā)展。從早期的黑白世界到彩色世界,顯示器走過了漫長而艱辛
    的頭像 發(fā)表于 12-18 09:12 ?3364次閱讀