chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

只要3千(美元),頂級GPU可擴展的深度學(xué)習(xí)計算機抱回家

zhKF_jqr_AI ? 來源:未知 ? 作者:李倩 ? 2018-09-28 09:02 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

如果你曾經(jīng)用過,或是打算在訓(xùn)練機器學(xué)習(xí)任務(wù)時使用AWS/Azure/GCloud,你就知道昂貴的GPU價格有多高。如果經(jīng)常開關(guān)機器,會對正在進行的任務(wù)有很大的干擾。原文作者Jeff Chen有一種更好的方法:搭建自己的深度學(xué)習(xí)計算機。它比上述方法便宜10倍,而且使用方便。下面就讓我們仔細分析一下。

這是深度學(xué)習(xí)計算機系列的第一篇(共有三篇)。第二部分將講述“如何搭建自己的計算機”,第三部分是“如何評估性能”。

自制深度學(xué)習(xí)計算機的內(nèi)部

只要3千(美元),頂級GPU可擴展的深度學(xué)習(xí)計算機抱回家

我自己花3千美元搭建的機器配置如下所示,其中有一個1080 Ti GPU、一個12核的CPU,一個64GRAM和1 TB M.2 SSD。除此之外你還可以再加三個GPU。

價格對比

假設(shè)這臺只有一個GPU的機器在未來三年不會折舊,下表顯示,如果你至少用了一年后,它會便宜10倍,其中包括電費。亞馬遜的AWS會給予長期使用者優(yōu)惠,如果你買了好幾年的AWS服務(wù),也許能便宜4—6倍,但仍然是一筆不小的費用。計算之后我們發(fā)現(xiàn),有四個GPU的機器版本能在一年內(nèi)便宜21倍!

自己打造的計算機和AWS的費用對比。根據(jù)不同的使用需求,一個GPU的版本可以便宜4—10倍,而四個GPU的版本可以便宜9—21倍。AWS全年訂閱可享受65折優(yōu)惠,三年可享受4折優(yōu)惠。假設(shè)電費為0.2美元/千瓦時,一個GPU一小時消耗1kw的電,四個GPU一小時消耗2kw。額外加入的GPU按700美元算,不加折舊率。

但是這樣也有一些缺點,例如下載速度會變慢,因為這并不在主干網(wǎng)上,靜態(tài)IP需要遠程接入,可能幾年之后你想更新GPU,即使這樣,省下的花費也很值得。

如果你想在深度學(xué)習(xí)計算機上運用2080Ti,它會貴一點,但仍然是劃算的。

云GPU每小時3美元,不用的時候也得交錢

亞馬遜的AWS EC2的GPU費用為每小時3美元,或者一個月大約2100美元。在斯坦福,我用它研究我的語義分割項目,最終賬單為1000美元。我還在另一個項目上試過谷歌云,最終花了1800美元,這還是我非常節(jié)約地在用,每次結(jié)束時都會關(guān)掉機器。但還是肉疼??!

即使關(guān)上了機器,你仍需要每月為機器支付0.1美元/GB的存儲費用,所以我每月在里面充100美元,防止數(shù)據(jù)丟失。

幾個月就回本

如果自己搭建了3千美元、含有一個GPU機器,如果經(jīng)常使用,兩個月后就會收支平衡。更不用提兩個月后它還沒有折損。所以權(quán)衡下來,還是四個GPU的版本更實惠,它不到一個月就能收回成本。

你的GPU性能和AWS不分上下

700美元的英偉達1080 Ti的速度就比英偉達的V100 云GPU(使用新一代Volta技術(shù))少了10%,這是因為云GPU在實例和GPU之間的IO很慢,所以即使是這樣,V100在理論上也會比現(xiàn)實中快1.5—2倍。由于你用的是M.2 SSD,IO在自己的電腦上就會非??臁?/p>

V100的顯存為16GB,而1080 Ti是11GB。但是如果能把batch的尺寸調(diào)小一些,模型就更高效,11GB也是可以的。

與在線租上一代英偉達K80相比,1080 Ti的訓(xùn)練速度比它快了4倍。我在基準(zhǔn)測試中驗證了它的速度快了3—4倍。K80的顯存只有12GB,相對于1080Ti的11GB,優(yōu)勢并不大。

AWS之所以這么貴是因為亞馬遜強制使用更貴的GPU

數(shù)據(jù)中心之所以這么貴的原因:他們并不使用GeForce 1080 Ti。英偉達禁止在數(shù)據(jù)中心使用GeForce和Titan卡,所以亞馬遜和其他供應(yīng)商只能用8500美元的GPU,所以收取的租金就很貴。

自己搭建比購買要好

同樣,你還要考慮在哪里購買計算機或搭建自己的機器,搭建機器最難的部分就是找到適合機器學(xué)習(xí)的部分,確保能正常工作。而組裝過程就更容易了,幾個小時就能搞定。

在價格下跌時出手

每年有新產(chǎn)品發(fā)布時,上一代硬件總會降價。例如,當(dāng)AMD推出Threadripper 2 CPU時,1920X處理器的價格從800美元直接腰斬到400美元。所以,可以選擇這個時候購買需要的硬件。

搭建能提供更多選擇,可以擴展

我看了一些現(xiàn)成的機器,其中一些無法用四個GPU,或者不能進行優(yōu)化。還有一些CPU沒有36+的PCle線程,或者主板不能插四個GPU,或者功率不夠1400W、CPU低于八核等等問題。在下一篇文章中,我會討論不同部分的選擇有哪些細微差別。

設(shè)計時還可考慮一些搭配美感,我個人覺得有些機箱很丑……不僅要降低噪音,還要支持機器學(xué)習(xí)。SATA3 SSD的讀寫速度為每秒600MB,而M.2 PCIe SSD快了5倍,并達到了每秒3.4GB。

結(jié)語

在下一篇文章中,我會討論如何為搭建機器選擇組件,請繼續(xù)關(guān)注!

FAQ

為什么深度學(xué)習(xí)計算機的可擴展性很重要?

如果你不知道需要多少計算力,最好的方法就是搭建一個只有一個GPU的機器,然后逐漸增加。

為什么選擇有四個GPU的機器?

如果你能承擔(dān)所需費用,可以根據(jù)需要隨意增減GPU。我只是找到了合適的主板,可以支持四個GPU。

網(wǎng)友討論

自己動手豐衣足食,還能省下一大筆錢,聽上去不錯,不過這種方法有無劣勢呢?

網(wǎng)友_untom_表示:

“目前來說,自己買機器確實便宜,這是毋庸置疑的。但是AWS解決的問題是大規(guī)模的。如果你所在的領(lǐng)域需要數(shù)十個、甚至上百個機器,而不是四臺機器,那么你只能選擇AWS或其他云服務(wù),除非你能自己買400個GPU?!?/p>

另外網(wǎng)友Spaturno說:

“如果你現(xiàn)在每六個月就要用到100倍的計算力,持續(xù)一周,哪種更劃算?”

網(wǎng)友currentaccount123:

“兩種方法我都買不起?!保ㄊ謩釉僖姡?/p>

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11074

    瀏覽量

    216880
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4937

    瀏覽量

    131168
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5560

    瀏覽量

    122758

原文標(biāo)題:買不起AWS的我,用便宜十倍的價錢搭了臺深度學(xué)習(xí)機器

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    GPU架構(gòu)深度解析

    GPU架構(gòu)深度解析從圖形處理到通用計算的進化之路圖形處理單元(GPU),作為現(xiàn)代計算機中不可或缺的一部分,已經(jīng)從最初的圖形渲染專用處理器,發(fā)
    的頭像 發(fā)表于 05-30 10:36 ?359次閱讀
    <b class='flag-5'>GPU</b>架構(gòu)<b class='flag-5'>深度</b>解析

    如何選擇合適的外形尺寸的工業(yè)計算機

    工業(yè)計算機尺寸的關(guān)鍵差異化因素工業(yè)計算機的尺寸因應(yīng)用要求、環(huán)境限制和性能能力而異。以下是區(qū)分它們的關(guān)鍵因素:物理尺寸(寬度、深度和高度):確定系統(tǒng)是否適合空間受限的機柜、控制面板或機架。
    的頭像 發(fā)表于 04-27 12:10 ?225次閱讀
    如何選擇合適的外形尺寸的工業(yè)<b class='flag-5'>計算機</b>

    解鎖新應(yīng)用:探索GPU擴展是如何提升渲染農(nóng)場的工作效率

    聯(lián)瑞GPU擴展方案在渲染農(nóng)場的應(yīng)用,是在原有計算機設(shè)備的基礎(chǔ)上增加GPU的數(shù)量,不用額外購買GPU服務(wù)器,有效的幫助企業(yè)降本增效.
    的頭像 發(fā)表于 01-09 17:13 ?404次閱讀
    解鎖新應(yīng)用:探索<b class='flag-5'>GPU</b><b class='flag-5'>擴展</b>是如何提升渲染農(nóng)場的工作效率

    工業(yè)中使用哪種計算機?

    在工業(yè)環(huán)境中,工控機被廣泛使用。這些計算機的設(shè)計承受極端溫度、灰塵和振動等惡劣條件。它們比標(biāo)準(zhǔn)消費類計算機更耐用、更可靠。工業(yè)計算機可控制機器、監(jiān)控流程并實時收集數(shù)據(jù)。其堅固的結(jié)構(gòu)和
    的頭像 發(fā)表于 11-29 14:07 ?697次閱讀
    工業(yè)中使用哪種<b class='flag-5'>計算機</b>?

    量子計算機與普通計算機工作原理的區(qū)別

    ? 本文介紹了量子計算機與普通計算機工作原理的區(qū)別。 量子計算是一個新興的研究領(lǐng)域,科學(xué)家們利用量子力學(xué),制造出具有革命性能力的計算機。雖然現(xiàn)在的量子
    的頭像 發(fā)表于 11-24 11:00 ?1455次閱讀
    量子<b class='flag-5'>計算機</b>與普通<b class='flag-5'>計算機</b>工作原理的區(qū)別

    GPU深度學(xué)習(xí)中的應(yīng)用 GPUs在圖形設(shè)計中的作用

    。 GPU的并行計算能力 GPU最初被設(shè)計用于處理圖形和圖像的渲染,其核心優(yōu)勢在于能夠同時處理成上萬的像素點。這種并行處理能力使得GPU
    的頭像 發(fā)表于 11-19 10:55 ?1602次閱讀

    pcie在深度學(xué)習(xí)中的應(yīng)用

    深度學(xué)習(xí)模型通常需要大量的數(shù)據(jù)和強大的計算能力來訓(xùn)練。傳統(tǒng)的CPU計算資源有限,難以滿足深度學(xué)習(xí)
    的頭像 發(fā)表于 11-13 10:39 ?1334次閱讀

    【小白入門必看】一文讀懂深度學(xué)習(xí)計算機視覺技術(shù)及學(xué)習(xí)路線

    一、什么是計算機視覺?計算機視覺,其實就是教機器怎么像我們?nèi)艘粯?,用攝像頭看看周圍的世界,然后理解它。比如說,它能認出這是個蘋果,或者那邊有輛車。除此之外,還能把拍到的照片或者視頻轉(zhuǎn)換成有用的信息
    的頭像 發(fā)表于 10-31 17:00 ?1214次閱讀
    【小白入門必看】一文讀懂<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b><b class='flag-5'>計算機</b>視覺技術(shù)及<b class='flag-5'>學(xué)習(xí)</b>路線

    GPU深度學(xué)習(xí)應(yīng)用案例

    GPU深度學(xué)習(xí)中的應(yīng)用廣泛且重要,以下是一些GPU深度學(xué)習(xí)應(yīng)用案例: 一、圖像識別 圖像識別是
    的頭像 發(fā)表于 10-27 11:13 ?1328次閱讀

    GPU計算主板學(xué)習(xí)資料第735篇:基于3U VPX的AGX Xavier GPU計算主板 信號計算主板 視頻處理 相機信號

    GPU計算主板學(xué)習(xí)資料第735篇:基于3U VPX的AGX Xavier GPU計算主板 信號
    的頭像 發(fā)表于 10-23 10:09 ?632次閱讀
    <b class='flag-5'>GPU</b><b class='flag-5'>計算</b>主板<b class='flag-5'>學(xué)習(xí)</b>資料第735篇:基于<b class='flag-5'>3</b>U VPX的AGX Xavier <b class='flag-5'>GPU</b><b class='flag-5'>計算</b>主板 信號<b class='flag-5'>計算</b>主板 視頻處理 相機信號

    深度學(xué)習(xí)GPU加速效果如何

    圖形處理器(GPU)憑借其強大的并行計算能力,成為加速深度學(xué)習(xí)任務(wù)的理想選擇。
    的頭像 發(fā)表于 10-17 10:07 ?603次閱讀

    計算機接口位于什么之間

    計算機接口是計算機硬件和軟件之間、計算機與外部設(shè)備之間以及計算機各部件之間傳輸數(shù)據(jù)、控制信息和狀態(tài)信息的硬件設(shè)備和軟件程序。它在計算機系統(tǒng)中
    的頭像 發(fā)表于 10-14 14:02 ?1290次閱讀

    晶體管計算機和電子管計算機有什么區(qū)別

    晶體管計算機和電子管計算機作為計算機發(fā)展史上的兩個重要階段,它們在多個方面存在顯著的區(qū)別。以下是對這兩類計算機在硬件、性能、應(yīng)用以及技術(shù)發(fā)展等方面區(qū)別的詳細闡述。
    的頭像 發(fā)表于 08-23 15:28 ?3572次閱讀

    如何利用ARMxy ARM嵌入式計算機的NPU進行深度學(xué)習(xí)模型的訓(xùn)練和優(yōu)化?

    在正文開始前,我們先大致了解鋇錸的ARMxy ARM嵌入式計算機,再來說說我們?nèi)绾卫肁RMxy ARM嵌入式計算機的NPU來實現(xiàn)深度學(xué)習(xí)模型的訓(xùn)練和優(yōu)化。 ARMxy系列的 ARM?
    的頭像 發(fā)表于 08-20 13:43 ?746次閱讀
    如何利用ARMxy ARM嵌入式<b class='flag-5'>計算機</b>的NPU進行<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>模型的訓(xùn)練和優(yōu)化?

    ARMxy ARM嵌入式計算機搭載 1 TOPS NPU支持深度學(xué)習(xí)

    ARMxy ARM嵌入式計算機BL410系列內(nèi)置了1TOPS算力 NPU,它每秒可以執(zhí)行高達一萬億次的浮點運算,這為復(fù)雜的圖像處理和深度學(xué)習(xí)任務(wù)提供了充足的計算資源。在產(chǎn)品缺陷檢測領(lǐng)域
    的頭像 發(fā)表于 08-20 11:53 ?834次閱讀
    ARMxy ARM嵌入式<b class='flag-5'>計算機</b>搭載 1 TOPS NPU支持<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>