chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

英特爾于AI的七重助力

h1654155282.3538 ? 來源:沈苗 ? 2019-08-23 09:46 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

今天,各行各業(yè)正與人工智能AI)加速融合,通過智能化創(chuàng)新來尋求業(yè)務轉型升級。與為數不多的頂級 AI 研發(fā)公司相比,大多數傳統行業(yè)或企業(yè)有著更豐富的 AI 應用場景,推動著規(guī)?;?AI 應用落地,其 AI 應用更具有實踐意義。然而,在智能化技術架構和平臺選擇上,它們又往往面臨著「拿著釘子到處找錘子」的尷尬局面。

盡管有人津津樂道于承載 AI 應用的一些專用架構平臺,但實際情況是:僅采用專用加速芯片或優(yōu)化單一框架,已經無法滿足運行不同工作負載和適應不同應用場景所需。這是因為,AI 的應用需求是多種多樣的,不同的應用也決定了從數據中心到邊緣再到設備所需的硬件能力都會有所差別。而且,解決企業(yè) AI 規(guī)?;涞兀枰浞掷靡詳祿橹行牡幕A架構,考慮芯片處理器、核心算法和軟件工具等平臺解決方案的選擇。

無論是算法工程師、AI 開發(fā)者還是數據科學家,他們在選擇 AI 技術架構和平臺時會有多方面的考量。一個共識是,基于既有的 IT 基礎設施,統一大數據和人工智能平臺,可以更加高效釋放數據價值,實現 AI 業(yè)務目標。人們正在發(fā)現,更加通用的英特爾架構具有重要的先發(fā)優(yōu)勢。由英特爾計算架構和至強平臺的助力,人工智能技術可以幫助企業(yè)從既有的平臺起步,加速「破局」AI 產業(yè)實踐。

英特爾 AI 架構帶來的優(yōu)勢可以從七個方面說起,其中包括性能、數據預處理、可擴展性、內存、模型部署、大數據分析,以及跨平臺部署應用。

第一重助力:性能

今天,CPU 性能優(yōu)化已有數量級的提升,VNNI 和框架優(yōu)化等大幅提升了 CPU 架構運行深度學習推理的速度。

很多人可能都認為 AI 這種新出現的技術,或者說應用負載,也應該用新的架構來支撐,其實不然。實際上隨著 CPU 性能的數量級提升,以及在軟硬件層面針對 AI 應用的不斷優(yōu)化,CPU 平臺也能很好地承載 AI 應用。現在 CPU 能兼容幾乎所有的 AI 主流技術,深度學習的應用任務,特別是推理,完全可以用 CPU 來搞定。而且 CPU 還有一個特定的優(yōu)勢,就是當用戶混合使用機器學習和深度學習方法時,CPU 更適合承載這樣的任務。

不斷更新換代的英特爾 CPU 平臺,已經在眾多 AI 應用,特別是推理上提供了強大的算力。以第二代英特爾至強可擴展處理器為例,它集成了加速人工智能深度學習推理的英特爾深度學習加速(英特爾 DL Boost)技術,將人工智能性能提升到一個全新的水平,可加速數據中心、企業(yè)和智能邊緣計算環(huán)境中的人工智能推理工作負載。以常見的 Caffe Resnet-50 模型為例來看性能變化,第二代英特爾至強鉑金 8280 處理器借助英特爾 DL Boost 技術,圖像識別的速度可比上一代英特爾至強可擴展處理器提升 14 倍。

另外,英特爾 CPU 平臺還與各類主流深度學習框架(包括 TensorFlow、PyTorch、caffe 、MXNet、PaddlePaddle、BigDL 等)合作,針對 CPU 的 AI 訓練和 AI 推理功能進行全面優(yōu)化,Xeon 處理器訓練性能因此得到不斷提升,客戶也可以選擇使用適合自身需求的深度學習框架做模型訓練,而無需購買或者設置不同的硬件基礎設施。

隨著軟件工具的不斷更新及面向主流框架的深度優(yōu)化,CPU 平臺不論是支持基于單一 AI 技術的應用,還是在運行融合了多種 AI 技術的應用時,其性能表現都更為突出。

對于全新硬件架構的每一個數量級的性能提升潛力,軟件能帶來超過兩個數量級的性能提升。以第二代英特爾至強可擴展處理器上的 VNNI 深度學習加速指令為例,過去卷積神經需要三條指令,而現在的話一條指令就可以了,通過在底層的軟硬件協同優(yōu)化,可根據不同深度學習框架將推理性能加速 2-3 倍甚至更多。

第二重助力:數據預處理

數據的處理分析和之后的 AI 應用如果在一個平臺上,可以給用戶帶來更大的便利性,也能節(jié)省成本和降低風險。

盡管當前市場對于 AI 技術抱有很大興趣,但實施水平仍然相當低下。我們需要根據應用需求構建起完整的數據分析/AI 流水線,從高質量數據源整理、數據預處理與清洗、適當特征數據的選擇與構建等前期工作開始,這就要求數據工程師、算法工程師等協同工作。

算法工程師往往要花很多時間,來處理用于深度學習模型訓練和測試的龐大數據,數據預處理會涉及很多很零碎的事情,比如校對數據的標注是否符合某種邏輯。在進行數據預處理時,所寫的代碼不一定是執(zhí)行起來效率最高的,因為有可能這些零碎的校驗數據功能只用一次,而不是反復使用。在這種情況下,可以使用方便快速實現功能的 Python 語言調用 CPU 來實現,而且基于 CPU 有很多現成的包和工具,具有更快數據預處理的優(yōu)勢。CPU 還可以通過使用更多內存、減少 I/O 操作來提升 AI 運行效率。

如今的深度學習和 AI 領域,優(yōu)秀的算法和框架數不勝數,但英特爾開源的 BigDL 和采用了這一技術的 Analytics Zoo 平臺選擇了一個頗具獨特性的切入點,那就是專為已有大數據集群的場景設計。目前,來自零售業(yè)、金融服務行業(yè)、醫(yī)療保健業(yè)、制造業(yè)及電信業(yè)等領域的企業(yè)客戶都已經開始在英特爾至強服務器上利用 Analytics Zoo、或基于 BigDL 構建更為平滑無縫的數據分析-AI 應用流水線。

第三重助力:可擴展性

作為普遍使用的基礎設施,CPU 平臺就是為可擴展性而搭建的,它們不僅易于在更多節(jié)點上進行擴展,還能按核實現彈性擴展和調配。

在深度學習和機器學習領域,不管是模型訓練還是推理,為了分配和部署計算能力,常常需要基于現有的 IT 基礎設施或者云平臺進行硬件擴展。目前一些專有的 AI 架構平臺只能以卡或芯片為單位來管理和擴展,而英特爾至強平臺不僅更容易在更多節(jié)點上擴展,還能按核實現彈性的擴展和調配,能真正做到精細化的資源管理和調配。這使得 AI 平臺可以盡可能通過云化來提高靈活性,提升自動化管理水平,并充分利用到每個計算核心的價值等。

比如有開發(fā)者指出,在新一代 Skylake-SP 微構架芯片設計上,英特爾首次開始采用了全新網格互連構架(Mesh Interconnect Architecture)設計方式,從傳統的利用環(huán)形連接,到了新設計則全面改采用網格互連的方式,來進行資料存取與控制指令的傳送。因為最小單位可以是以每行、每列來連接,所以每顆 Skylake-SP 核心、緩存、內存控制器及 I/O 控制器之間的路徑選擇變得更多元,還可以跨不同的節(jié)點互連,以尋找最短的數據傳遞捷徑,即使是加大核心數量,也能夠維持很快存取數據,并支持更高內存頻寬,以及更高速的 I/O 傳輸。

第四重助力:內存

CPU 易擴展緩存,而英特爾傲騰 DC 持久內存 Apache Pass 更是集大容量、經濟性和持久性于一身,性能接近 DRAM。

不論是 AI 訓練還是推理,靠近計算單元的內存或者說較高速的數據緩存都非常重要。在 AI 分析中,它們對訓練中的神經網絡構建,并通過該網絡進行推理比較都有著重要的影響。因此我們希望在靠近計算單元的地方盡可能緩存更多數據。其容量的增加,會很大程度上提高 AI 的整體性能、準確性、響應速度。

訓練深度學習模型時,占用 CPU 內存比較大,一般來說單臺刀片可以輕松做到 256GB 以上的內存,做分布式訓練時還可以把數據分配到不同機器上進行計算,而且可以盡量把數據預存到 CPU。此外,CPU 大內存的優(yōu)勢不僅體現在訓練上,更主要的是推理,比如對尺寸很大的醫(yī)療影像模型進行推理處理。

即使沒有英特爾傲騰數據中心級持久內存的出現,英特爾至強處理器平臺也很容易擴展內存的容量。但有了這種全新類型的產品后,內存的存儲密度/價格比可能會更理想,其性能也接近 DRAM,讓更大量的數據可以更接近 CPU 進行移動和處理,極大地降低從系統存儲獲取數據的延遲。相比之下,專有架構平臺要擴展緩存,還是很不方便的。

第五重助力:模型部署

英特爾技術產品從端到端是有統一的應用兼容性的,這樣可以保證我們在后端訓練迭代算法,前端部署推理。

在深度學習實踐中,是否應該去搭建一套新的專用平臺?持否定意見的開發(fā)者認為,目前主要用于 AI 模型推理的平臺都是基于 CPU 架構的,應該利用現有的數據中心基礎設施,利用現有的、熟悉的處理器平臺,以最低的成本部署人工智能,這相比另起爐灶、尋找其他計算平臺的方法,用時更短 、風險更低、性價比更高。

有開發(fā)者據此總結了三條理由:首先,現如今標準 CPU 平臺完全能夠勝任 AI 所有應用;其次,現在 AI 屬于「試錯階段「,同時技術也在快速演變和迭代,利用現有的 CPU 平臺,可以最小成本做最大的事,無需大量額外投資,但如果另起爐灶可能得不償失;最后,用多年熟悉且信任的 CPU 平臺,構建「激進」的 AI 項目,本身就是一個絕好的平衡,讓技術風險變得可控。

在現有英特爾架構支持的數據應用基礎上構建 AI 應用,生產環(huán)境非常成熟,易于部署,運維人員學習難度低。英特爾從云到端都有硬件平臺就緒,不論是通用計算還是專用芯片(如 Movidius),而且還有相關的軟件支持,如眾多優(yōu)化庫、框架和工具。另外,英特爾為 AI 應用的開發(fā)者們提供了 OpenVINO 等工具包,可以方便實現模型部署,優(yōu)勢顯著。

第六重助力:大數據分析

英特爾至強處理器和 BigDL 軟硬搭配,在 Hadoop 和 Spark 等主流大數據框架上,可以簡化訓練(數據獲取+處理)過程。

Hadoop 和 Spark 是目前非常流行的大數據管理和處理框架,想利用它們承載的數據進行深度學習訓練,通常需要把這些數據導出,然后進行處理,這個過程不僅耗時而且投資較大,所以在這些大數據平臺上進行深度學習訓練顯得尤為重要。

有開發(fā)者認為,可以針對各種不同來源的數據,首先根據目標算法需要的數據格式,進行數據整合。得到目標數據之后,再根據業(yè)務需要,按照對應的比例,將最原始的數據分成訓練數據和測試數據,通過算法對數據不斷進行訓練,后期進行相應的測試。

其實更好的方式是打通數據流水線。英特爾的 Analytics Zoo(內含 BigDL)打通端到端數據流水線,在 Hadoop 和 Spark 等主流的大數據框架上,把數據的收集、存儲、傳輸、預處理、后期處理等環(huán)節(jié),與 AI 的訓練和預測等部分有機結合起來,就可以讓企業(yè)的數據分析流水線變得高效而統一。例如,英特爾協助美的公司基于 Analytics Zoo 構建了一套端到端的產品缺陷檢測方案,準確率優(yōu)于人工檢查方法,并避免了檢查工作給生產線帶來侵入性影響。

Analytics Zoo 將 Spark、TensorFlow 以及 BigDL 程序整合至同一流水線當中,整個流水線能夠在 Spark 集群之上以透明方式實現擴展,從而進行分布式訓練與推理。最終使美的的圖像預處理時長由 200 毫秒降低至 50 毫秒,并將延遲影響由 2,000 毫秒縮短至 124 毫秒。

第七重助力:跨平臺部署應用

英特爾至強處理器、Analytics Zoo 以及 OpenVINO 工具包,能夠簡化深度學習流水線,實現一站式端到端的 AI 應用部署。

深度學習應用的開發(fā)周期很長,而且往往會涉及多個工具和平臺,如何將新技術、新創(chuàng)新應用到非常大規(guī)模、大數據的生產系統中,目前在軟硬件架構上有非常大的斷層。這提升了技術開發(fā)門檻,開發(fā)者十分期待從云端到終端能跨平臺部署深度學習應用。

2018 年,英特爾開源了 Analytics Zoo,構建了端到端的大數據分析+AI 平臺,無論是用 TensorFlow 還是 Keras,都能將這些不同模塊的程序無縫運行在端到端流水線上,大大提升了開發(fā)效率。

并且,Analytics Zoo 也兼容 OpenVINO在 AI 應用上的加速特性?;谟⑻貭栍布脚_、專注于加速深度學習的 OpenVINO工具套件,是一個快速開發(fā)高性能計算機視覺和深度學習視覺應用的工具包。

英特爾 OpenVINO 工具套件不僅適用于開發(fā)可模擬人類視覺的應用和解決方案,它還可以通過英特爾 FPGA 深度學習加速套件支持 FPGA,旨在通過優(yōu)化廣泛使用的 Caffe 和 TensorFlow 框架來簡化采用英特爾 FPGA 的推理工作負載,并用于包括圖像分類、機器視覺自動駕駛、軍事以及醫(yī)療診斷等應用。

OpenVINO工具包基于卷積神經網絡(CNN),可擴展英特爾硬件(包括加速器)的工作負載,并最大限度地提高性能。

具體來說,OpenVINO 具有面向 OpenCV 和 OpenVx 的優(yōu)化計算機視覺庫,并支持跨計算機視覺加速器的異構執(zhí)行,可通過基于英特爾架構的處理器(CPU)及核顯(Integrated GPU)和深度學習加速器(FPGA、Movidius VPU)的深度學習加速芯片,增強視覺系統功能和性能。它支持 在邊緣端進行深度學習推理,并加速高性能計算機視覺應用,幫助開發(fā)人員和數據科學家提高計算機視覺應用性能,簡化深度學習部署過程。

AI 應用落地的實際選擇

經過上述分析我們可以發(fā)現,在七個方面中,每個維度都支持 CPU 架構和平臺的優(yōu)勢。一方面,CPU 的計算能力通過軟硬件協同優(yōu)化不斷提升,可以更好地適應 AI 場景需求,企業(yè)漸漸意識到用 CPU 做 AI 已經「足夠好」;另一方面,通過收購和探索不同芯片架構,英特爾的 AI 軟硬件產品組合正在不斷完善,這使得英特爾能夠建立一個完整的 AI 基礎架構,非常豐富的產品組合是英特爾與其他公司實現差異化的最大亮點。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • 英特爾
    +關注

    關注

    61

    文章

    10272

    瀏覽量

    179183
  • AI
    AI
    +關注

    關注

    89

    文章

    38010

    瀏覽量

    295993
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    主控CPU全能選手,英特爾至強6助力AI系統高效運轉

    2025年3月,英偉達發(fā)布了DGX B300 AI加速計算平臺。2025年5月,英特爾發(fā)布了三款全新英特爾至強6性能核處理器,其中一款6776P被用作是DGX B300的主控CPU,這款處理器究竟
    的頭像 發(fā)表于 06-27 11:44 ?589次閱讀
    主控CPU全能選手,<b class='flag-5'>英特爾</b>至強6<b class='flag-5'>助力</b><b class='flag-5'>AI</b>系統高效運轉

    英特爾發(fā)布邊緣AI控制器與邊緣智算一體機,創(chuàng)造“AI新視界”

    在2025北京機器視覺展覽會(VisionChina)以“AI 視界:英特爾推動智能制造革新浪潮”為主題的英特爾論壇中,英特爾與諾達佳聯合發(fā)布了 基于
    發(fā)表于 06-24 17:50 ?1379次閱讀
    <b class='flag-5'>英特爾</b>發(fā)布邊緣<b class='flag-5'>AI</b>控制器與邊緣智算一體機,創(chuàng)造“<b class='flag-5'>AI</b>新視界”

    英特爾銳炫Pro B系列,邊緣AI的“智能引擎”

    2025年6月19日,上海—— 在MWC 25上海期間,英特爾展示了一幅由英特爾銳炫? Pro B系列GPU所驅動的“實時響應、安全高效、成本可控”的邊緣AI圖景。 英特爾客戶端計算事
    的頭像 發(fā)表于 06-20 17:32 ?687次閱讀
    <b class='flag-5'>英特爾</b>銳炫Pro B系列,邊緣<b class='flag-5'>AI</b>的“智能引擎”

    直擊Computex2025:英特爾重磅發(fā)布新一代GPU,圖形和AI性能躍升3.4倍

    5月19日,在Computex 2025上,英特爾發(fā)布了最新全新圖形處理器(GPU)和AI加速器產品系列。包括全新英特爾銳炫? Pro B系列GPU——英特爾銳炫Pro B60和
    的頭像 發(fā)表于 05-20 12:27 ?5116次閱讀
    直擊Computex2025:<b class='flag-5'>英特爾</b>重磅發(fā)布新一代GPU,圖形和<b class='flag-5'>AI</b>性能躍升3.4倍

    英特爾發(fā)布全新GPU,AI和工作站迎來新選擇

    英特爾推出面向準專業(yè)用戶和AI開發(fā)者的英特爾銳炫Pro GPU系列,發(fā)布英特爾? Gaudi 3 AI加速器機架級和PCIe部署方案 ? 2
    發(fā)表于 05-20 11:03 ?1663次閱讀

    AI驅動零售變革!英特爾AI方案助力中國廠商海外破局

    本次零售行業(yè)大會上,英特爾帶來了哪些技術解決方案?英特爾POS認證計劃的推出,對于合作伙伴開拓海外市場帶來哪些助力英特爾中國網絡與邊緣技術產品總監(jiān)王景佳、
    的頭像 發(fā)表于 05-15 18:19 ?6546次閱讀
    <b class='flag-5'>AI</b>驅動零售變革!<b class='flag-5'>英特爾</b><b class='flag-5'>AI</b>方案<b class='flag-5'>助力</b>中國廠商海外破局

    英特爾酷睿Ultra處理器助力亦心AI閃繪本地功能上線

    英特爾酷睿Ultra處理器支持的AI實時繪畫軟件“亦心AI閃繪”本地功能已正式上線,能夠基于本地大模型實現繪畫功能,助力用戶低成本高效沉浸藝術創(chuàng)作,釋放無限創(chuàng)意潛能。
    的頭像 發(fā)表于 04-02 15:27 ?922次閱讀

    英特爾先進封裝:助力AI芯片高效集成的技術力量

    ),以靈活性強、能效比高、成本經濟的方式打造系統級芯片(SoC)。因此,越來越多的AI芯片廠商青睞這項技術。 英特爾自本世紀70年代起持續(xù)創(chuàng)新,深耕封裝技術,積累了超過50年的豐富經驗。面向AI時代,
    的頭像 發(fā)表于 03-28 15:17 ?637次閱讀
    <b class='flag-5'>英特爾</b>先進封裝:<b class='flag-5'>助力</b><b class='flag-5'>AI</b>芯片高效集成的技術力量

    英特爾至強6處理器助力數據中心整合升級

    繼去年9月磅推出英特爾 至強 6900性能核處理器后,英特爾進一步擴充至強6產品家族,近期發(fā)布了包括至強6700性能核處理器及至強6500性能核處理器在內的多款新品,以更豐富的產品
    的頭像 發(fā)表于 03-13 17:36 ?1241次閱讀

    英特爾塑造未來出行:AI增強型軟件定義汽車

    近日,英特爾正引領一場汽車行業(yè)的革命,通過其創(chuàng)新技術為用戶帶來前所未有的車載體驗。基于英特爾第一代AI增強型軟件定義車載SoC(系統級芯片)和全新英特爾銳炫?車載獨立顯卡,
    的頭像 發(fā)表于 01-14 11:20 ?879次閱讀

    英特爾2024產品年鑒:AI與軟硬件的融合發(fā)展

    在2024年里,英特爾收獲了一系列軟件突破和硬件革新,也收獲了生態(tài)伙伴的支持與陪伴。通過不斷迭代的硬件產品,和持續(xù)開放的軟件生態(tài),從數據中心和云,到邊緣計算和PC的每一個角落,英特爾都在助力釋放
    的頭像 發(fā)表于 12-31 17:28 ?689次閱讀
    <b class='flag-5'>英特爾</b>2024產品年鑒:<b class='flag-5'>AI</b>與軟硬件的融合發(fā)展

    英特爾推出全新英特爾銳炫B系列顯卡

    備受玩家青睞的價格提供卓越的性能與價值1,很好地滿足現代游戲需求,并為AI工作負載提供加速。其配備的英特爾Xe矩陣計算引擎(XMX),為新推出的XeSS 2提供強大支持。XeSS 2的三項核心技術協同工作,共同提高性能表現、增強視覺流暢性并加快響應速度。 “ ? 全新
    的頭像 發(fā)表于 12-07 10:16 ?1905次閱讀
    <b class='flag-5'>英特爾</b>推出全新<b class='flag-5'>英特爾</b>銳炫B系列顯卡

    英特爾發(fā)布全新企業(yè)AI一體化方案

    近日,英特爾正式推出了全新的企業(yè)AI一體化方案。該方案以英特爾至強處理器和英特爾Gaudi 2D AI加速器為核心硬件,結合OPEA開放軟件
    的頭像 發(fā)表于 12-03 11:20 ?851次閱讀

    英特爾CEO Gelsinger宣布退休

    聯席首席執(zhí)行官,以確保公司的平穩(wěn)過渡。目前,英特爾的董事會正在積極尋找合適的人選,以填補這一要職位的空缺。 Pat Gelsinger在英特爾度過了超過四十年的職業(yè)生涯,他的成長歷程堪稱傳奇。從最初的一名普通員工,他憑借出色的
    的頭像 發(fā)表于 12-03 10:55 ?875次閱讀

    英特爾發(fā)布全新企業(yè)AI一體化解決方案

    近日,英特爾正式推出了其全新的企業(yè)AI一體化解決方案,這一方案旨在為企業(yè)提供更加開放、可擴展且高效的端到端服務。 該方案的核心在于其全棧硬件的支撐,包括英特爾至強處理器和英特爾Gaud
    的頭像 發(fā)表于 12-02 10:48 ?1190次閱讀