chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

GPU虛擬化的4個(gè)主要指標(biāo)和4種實(shí)現(xiàn)策略

汽車(chē)玩家 ? 來(lái)源:CSDN ? 作者:YuanruiZJU ? 2020-05-03 12:04 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

GPU虛擬化的評(píng)價(jià)標(biāo)準(zhǔn)

4個(gè)主要指標(biāo)用于評(píng)價(jià)GPU虛擬化的方法:

性能(performance)

保真度(fidelity)

資源復(fù)用(multiplexing)

是否支持虛擬化的特性(interposition)

其中性能和保真度強(qiáng)調(diào)減小GPU虛擬化的代價(jià),性能是指執(zhí)行操作的速度,保真度是指支持多少GPU提供的特性,以及對(duì)這些特性的支持的質(zhì)量。資源復(fù)用以及是否支持虛擬化的特性則強(qiáng)調(diào)虛擬化為我們帶來(lái)價(jià)值。資源復(fù)用是指能夠使多臺(tái)虛擬機(jī)共享同一個(gè)物理GPU的能力,資源復(fù)用要求虛擬機(jī)之間的安全隔離,GPU資源復(fù)用提高了GPU資源利用率,在保持虛擬機(jī)內(nèi)GPU性能不下降的情況下,復(fù)用一個(gè)GPU的虛擬機(jī)越多,對(duì)應(yīng)的GPU虛擬化方案越符合資源復(fù)用的要求。是否支持虛擬化的特性是指GPU虛擬化的方案是否能支持虛擬化技術(shù)提供的虛擬機(jī)與物理機(jī)之間的中介過(guò)程,如要求虛擬機(jī)創(chuàng)建系統(tǒng)還原點(diǎn),或者掛起,以及更加高級(jí)的特性,如熱遷移、可容錯(cuò)執(zhí)行等。這些標(biāo)準(zhǔn)經(jīng)常是相對(duì)的,比如要提升性能,就需要犧牲虛擬化的其他特性。

GPU虛擬化技術(shù)的實(shí)現(xiàn)策略分類

GPU虛擬化的目標(biāo)是為虛擬機(jī)提供虛擬GPU設(shè)備的支持,使得虛擬機(jī)內(nèi)部調(diào)用的與GPU相關(guān)的指令或者與GPU相關(guān)的API(比如OpenCL或者CUDA)能夠正常得執(zhí)行。

為了提升GPU虛擬化的性能,虛擬機(jī)需要利用GPU硬件來(lái)實(shí)現(xiàn)加速,也就是說(shuō)虛擬機(jī)內(nèi)部調(diào)用的GPU相關(guān)的命令或者GPU相關(guān)的API,能夠在硬件GPU上運(yùn)行。所有GPU虛擬化技術(shù)的實(shí)現(xiàn)策略以及GPU虛擬化技術(shù)的發(fā)展都圍繞著這一目標(biāo)。

下面列舉了四種GPU虛擬化技術(shù)的實(shí)現(xiàn)策略,按照利用GPU硬件加速的程度從小到大分別為分為設(shè)備模擬(Device Emulation)、API轉(zhuǎn)發(fā)(API Forwarding)、中介傳遞(Mediated Pass-through)和直接傳遞(Direct Pass-through也被稱為Fixed Pass-through),如圖所示。

下面對(duì)這四種實(shí)現(xiàn)策略分別介紹:

設(shè)備模擬(Device Emulation)

設(shè)備模擬是指通過(guò)軟件的方法來(lái)為虛擬機(jī)模擬GPU設(shè)備,這種方法的好處是虛擬機(jī)內(nèi)部都可以調(diào)用GPU命令,可以完全記錄GPU設(shè)備的狀態(tài),保證虛擬化技術(shù)的全部特性,滿足四個(gè)標(biāo)準(zhǔn)中的資源復(fù)用和支持虛擬化特性的標(biāo)準(zhǔn)。QEMU 通過(guò)軟件模擬實(shí)現(xiàn)了傳統(tǒng)的VGA設(shè)備,但是該設(shè)備的性能很低,只能支持基礎(chǔ)的功能。軟件模擬設(shè)備的方法幾乎不會(huì)使用硬件加速,因此其實(shí)現(xiàn)的GPU性能已經(jīng)無(wú)法滿足現(xiàn)在虛擬機(jī)的圖形圖像處理和高性能計(jì)算的需求。而且正如前文提到的,現(xiàn)代GPU架構(gòu)具有很高的復(fù)雜性,而且缺少文檔,因此很難實(shí)現(xiàn)對(duì)一個(gè)真實(shí)的物理GPU進(jìn)行軟件模擬。這意味著設(shè)備模擬方法只能模擬少量的API,只能保證少量的GPU特性提供給虛擬機(jī)。由于設(shè)備模擬的方法在性能和支持的GPU特性上和真實(shí)的GPU相差過(guò)大,設(shè)備模擬的技術(shù)已經(jīng)不再應(yīng)用到GPU虛擬化技術(shù)中。

API轉(zhuǎn)發(fā)(API Forwarding)

API轉(zhuǎn)發(fā)是指通過(guò)實(shí)現(xiàn)包裹圖形API的庫(kù),這些庫(kù)在虛擬機(jī)調(diào)用相關(guān)的API時(shí),將這些圖形API通過(guò)遠(yuǎn)程過(guò)程調(diào)用的方法轉(zhuǎn)發(fā)到主機(jī)上,然后調(diào)用主機(jī)上的圖形驅(qū)動(dòng)提供的API支持完成調(diào)用。通過(guò)給高層的API實(shí)現(xiàn)包裹庫(kù),客戶機(jī)就能支持高層的API如CUDA。vCUDA、vGRIS等虛擬化方案都是利用API轉(zhuǎn)發(fā)的方法。這種方法的優(yōu)點(diǎn)是利于實(shí)現(xiàn),而且一定程度上利用了GPU硬件實(shí)現(xiàn)加速,同時(shí)可以使多個(gè)虛擬機(jī)調(diào)用的GPU相關(guān)指令與API在物理GPU上執(zhí)行。但是API轉(zhuǎn)發(fā)的主要問(wèn)題在于這種方法失去了語(yǔ)言和庫(kù)的靈活性選擇,包裹庫(kù)和支持的API的不匹配會(huì)造成GPU虛擬化不成功。而如果在遷移的過(guò)程中,目標(biāo)主機(jī)與源主機(jī)的包裹庫(kù)版本不一致,可能會(huì)造成遷移之后GPU虛擬化不成功,因此API轉(zhuǎn)發(fā)會(huì)影響虛擬化提供的特性。

中介傳遞(Mediated Pass-through)

GPU已經(jīng)可以支持多個(gè)獨(dú)立的上下文,中介傳遞的方法使虛擬機(jī)只占用這些上下文的一個(gè)或者子集。高帶寬操作(指令緩存提交、幀緩存提交)需要使用映射到物理GPU的內(nèi)存或者M(jìn)MIO資源,低帶寬操作(資源分配、傳統(tǒng)的特性)可能會(huì)通過(guò)使用全虛擬化的資源來(lái)實(shí)現(xiàn)。

直接傳遞(Direct Pass-through)

直接傳遞是指給一臺(tái)虛擬機(jī)使用一個(gè)物理GPU的全部訪問(wèn)權(quán)限。Intel提供了Intel VT-d硬件輔助技術(shù),使研究者不需要去了解GPU的編程接口就可以直接實(shí)現(xiàn)一臺(tái)虛擬機(jī)占用物理GPU的全部訪問(wèn)權(quán)限。這種方法的好處在于可以提供與真實(shí)機(jī)器相近的性能以及保真度,亞馬遜的Amazon EC2提供的GPU資源就是使用這種虛擬化策略。但是這種方法問(wèn)題在于一個(gè)物理GPU只能被一臺(tái)虛擬機(jī)使用,犧牲了GPU資源在多臺(tái)機(jī)器之間共享的條件。而且虛擬化的遷移功能也會(huì)受到影響,因?yàn)椴煌w系架構(gòu)的GPU之間可能存在不兼容。

全虛擬化與半虛擬化

GPU虛擬化實(shí)現(xiàn)策略按照是否需要修改客戶機(jī)操作系統(tǒng)內(nèi)部的驅(qū)動(dòng)代碼分為GPU全虛擬化和GPU半虛擬化。GPU全虛擬化是指實(shí)現(xiàn)在多個(gè)虛擬機(jī)之間共享GPu資源的同時(shí)不需要修改虛擬機(jī)內(nèi)部的圖形驅(qū)動(dòng)。GPU半虛擬化是指向虛擬機(jī)提供軟件實(shí)現(xiàn)的理想設(shè)備模型,對(duì)客戶機(jī)的圖形驅(qū)動(dòng)進(jìn)行底層的控制。使用GPU半虛擬化的方法,比API轉(zhuǎn)發(fā)的性能消耗更小,但是客戶機(jī)的設(shè)備驅(qū)動(dòng)必須要改寫(xiě)。主流的GPU虛擬化方案GPUvm使用半虛擬化的實(shí)現(xiàn)策略對(duì)虛擬機(jī)GPU的性能有明顯的改善。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5196

    瀏覽量

    135519
  • 虛擬機(jī)
    +關(guān)注

    關(guān)注

    1

    文章

    972

    瀏覽量

    30493
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    AI大算力的存儲(chǔ)技術(shù), HBM 4E轉(zhuǎn)向定制

    電子發(fā)燒友網(wǎng)報(bào)道(文/黃晶晶)如今英偉達(dá)GPU迭代速度加快至每年一次,HBM存儲(chǔ)速率如何跟上GPU發(fā)展節(jié)奏。越來(lái)越多的超大規(guī)模云廠商、GPU廠商開(kāi)始轉(zhuǎn)向定制HBM。而HBM存儲(chǔ)廠商以
    的頭像 發(fā)表于 11-30 00:31 ?8530次閱讀
    AI大算力的存儲(chǔ)技術(shù), HBM <b class='flag-5'>4</b>E轉(zhuǎn)向定制<b class='flag-5'>化</b>

    結(jié)構(gòu)布線中使用電纜標(biāo)簽的4個(gè)主要優(yōu)勢(shì)

    帶來(lái)諸多顯著的優(yōu)勢(shì)。本文將深入探討在結(jié)構(gòu)布線中使用電纜標(biāo)簽的4個(gè)主要優(yōu)勢(shì),幫助讀者更好地理解這一細(xì)節(jié)的重要性。 提高布線系統(tǒng)的可管理性 清晰標(biāo)識(shí)電纜用途 在復(fù)雜的布線系統(tǒng)中,各種電纜
    的頭像 發(fā)表于 11-24 10:34 ?338次閱讀

    車(chē)載軟件vECU虛擬測(cè)試解決方案

    虛擬測(cè)試:利用虛擬技術(shù),實(shí)現(xiàn)將真實(shí)域控制器轉(zhuǎn)化為虛擬域控制器,運(yùn)行在PC或服務(wù)器環(huán)境中運(yùn)行,
    的頭像 發(fā)表于 10-30 09:34 ?1705次閱讀
    車(chē)載軟件vECU<b class='flag-5'>虛擬</b><b class='flag-5'>化</b>測(cè)試解決方案

    多網(wǎng)融合時(shí)代:4G/Wi-Fi/以太網(wǎng)/虛擬網(wǎng)卡配置實(shí)戰(zhàn)!

    在物聯(lián)網(wǎng)與邊緣計(jì)算快速發(fā)展的今天,掌握多種網(wǎng)絡(luò)接口的配置至關(guān)重要。本文以實(shí)戰(zhàn)為導(dǎo)向,詳解4G、Wi-Fi、以太網(wǎng)和虛擬網(wǎng)卡的接入與協(xié)同策略。 網(wǎng)絡(luò)適配器,它的一個(gè)更廣為人知的名字是——
    的頭像 發(fā)表于 10-09 18:25 ?313次閱讀
    多網(wǎng)融合時(shí)代:<b class='flag-5'>4</b>G/Wi-Fi/以太網(wǎng)/<b class='flag-5'>虛擬</b>網(wǎng)卡配置實(shí)戰(zhàn)!

    如何看懂GPU架構(gòu)?一分鐘帶你了解GPU參數(shù)指標(biāo)

    分析GPU核心參數(shù)體系:算力、顯存大小、顯存帶寬、熱門(mén)架構(gòu)特性等關(guān)鍵指標(biāo),旨在幫您理解不同應(yīng)用場(chǎng)景下,如何選擇最合適的GPU算力解決方案。1、算力GPU執(zhí)行浮點(diǎn)運(yùn)算
    的頭像 發(fā)表于 10-09 09:28 ?1147次閱讀
    如何看懂<b class='flag-5'>GPU</b>架構(gòu)?一分鐘帶你了解<b class='flag-5'>GPU</b>參數(shù)<b class='flag-5'>指標(biāo)</b>

    為什么無(wú)法在GPU上使用INT8 和 INT4量化模型獲得輸出?

    安裝OpenVINO? 2024.0 版本。 使用 optimum-intel 程序包將 whisper-large-v3 模型轉(zhuǎn)換為 int 4 和 int8,并在 GPU 上使用 OpenVINO? 運(yùn)行推理。 沒(méi)有可用的輸出。
    發(fā)表于 06-23 07:11

    電壓放大器的主要指標(biāo)是什么意思

    是一個(gè)需要重點(diǎn)考慮的指標(biāo)。 電壓放大器的主要指標(biāo)包括增益、帶寬、輸入阻抗、輸出阻抗、噪聲系數(shù)、失真度、功率輸出、頻率響應(yīng)、動(dòng)態(tài)范圍、電源電壓和功耗等。這些指標(biāo)共同決定了放大器的性能和適
    發(fā)表于 06-12 14:33

    提供4個(gè)觸摸輸入端口及4個(gè)直接輸出端口的4鍵觸摸檢測(cè)IC-CT8224C

    CT8224C是一款使用電容式感應(yīng)原理設(shè)計(jì)的觸摸IC,此款I(lǐng)C內(nèi)建穩(wěn)壓電路給觸摸感測(cè)器使用,穩(wěn)定的感應(yīng)方式可以應(yīng)用到各種不同電子類產(chǎn)品。面板介質(zhì)可以是完全絕源的材料,專為取代傳統(tǒng)的機(jī)械結(jié)構(gòu)開(kāi)關(guān)或普通按鍵而設(shè)計(jì),提供4個(gè)觸摸輸入端口及4
    的頭像 發(fā)表于 06-05 09:38 ?787次閱讀
    提供<b class='flag-5'>4</b><b class='flag-5'>個(gè)</b>觸摸輸入端口及<b class='flag-5'>4</b><b class='flag-5'>個(gè)</b>直接輸出端口的<b class='flag-5'>4</b>鍵觸摸檢測(cè)IC-CT8224C

    虛擬數(shù)據(jù)恢復(fù)—XenServer虛擬平臺(tái)上VPS不可用的數(shù)據(jù)恢復(fù)案例

    虛擬環(huán)境: 某品牌720服務(wù)器中有一組通過(guò)型號(hào)為H710P的RAID卡+4塊STAT硬盤(pán)組建的RAID10,上層部署Xen Server服務(wù)器虛擬
    的頭像 發(fā)表于 05-30 11:35 ?702次閱讀
    <b class='flag-5'>虛擬</b><b class='flag-5'>化</b>數(shù)據(jù)恢復(fù)—XenServer<b class='flag-5'>虛擬</b><b class='flag-5'>化</b>平臺(tái)上VPS不可用的數(shù)據(jù)恢復(fù)案例

    六類非屏蔽雙絞線主要指標(biāo)有哪些

    六類非屏蔽雙絞線(CAT6 UTP)是綜合布線系統(tǒng)中常用的高性能傳輸介質(zhì),其核心指標(biāo)直接決定了網(wǎng)絡(luò)傳輸?shù)姆€(wěn)定性、速度和抗干擾能力。以下是其主要技術(shù)指標(biāo)及分析: 1. 傳輸性能 帶寬:250MHz
    的頭像 發(fā)表于 05-08 10:09 ?3749次閱讀

    基于Infineon TC4D9+TLF4D985的Aurix StartKit

    狀態(tài)預(yù)測(cè),提升續(xù)航里程、充電速度和電池壽命;牽引逆變器領(lǐng)域,其創(chuàng)新cDSP與虛擬傳感技術(shù)優(yōu)化能量回收與控制策略;在電源轉(zhuǎn)換方面,TC4xx支持SiC和GaN材料,集成高效控制功能,提升系統(tǒng)效率。
    的頭像 發(fā)表于 04-16 14:16 ?1260次閱讀
    基于Infineon TC<b class='flag-5'>4D9+TLF4</b>D985的Aurix StartKit

    NVIDIA虛擬GPU 18.0版本的亮點(diǎn)

    NVIDIA 虛擬 GPU(vGPU)技術(shù)可在虛擬桌面基礎(chǔ)設(shè)施(VDI)中解鎖 AI 功能,使其比以往更加強(qiáng)大、用途更加廣泛。vGPU 通過(guò)為各種虛擬
    的頭像 發(fā)表于 04-07 11:28 ?1444次閱讀

    數(shù)字萬(wàn)用表的主要指標(biāo)及相互關(guān)系

    隨著電子技術(shù)的進(jìn)步,科研和生產(chǎn)中,對(duì)數(shù)字多用表(以下簡(jiǎn)稱數(shù)字表)的顯示位數(shù)、分辨力、測(cè)試精度和測(cè)試功能的要求不斷提高。這里給大家詳細(xì)講講數(shù)字萬(wàn)用表的主要指標(biāo)和相互關(guān)系。一、數(shù)字萬(wàn)用表的主要指標(biāo)1
    的頭像 發(fā)表于 04-03 17:21 ?1629次閱讀
    數(shù)字萬(wàn)用表的<b class='flag-5'>主要指標(biāo)</b>及相互關(guān)系

    RT-Thread虛擬部署DeepSeek大模型實(shí)踐

    Cortex-A55,8GBLPDDR4),通過(guò)虛擬技術(shù)實(shí)現(xiàn)虛擬Linux+RTOS混合部署
    的頭像 發(fā)表于 03-12 18:38 ?1302次閱讀
    RT-Thread<b class='flag-5'>虛擬</b><b class='flag-5'>化</b>部署DeepSeek大模型實(shí)踐

    4芯光纜是不是代表可以走4路網(wǎng)絡(luò)

    4芯光纜并不意味著可以直接走4路網(wǎng)絡(luò)。光纜的芯數(shù)主要指的是光纜內(nèi)部光纖的數(shù)量,而光纖則是用來(lái)傳輸光信號(hào)的媒介。在光纜中,每一根光纖都可以獨(dú)立地傳輸一路光信號(hào),因此理論上4芯光纜可以支持
    的頭像 發(fā)表于 03-12 11:01 ?1301次閱讀