chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Analytics Zoo: 統(tǒng)一的大數(shù)據(jù)分析+AI 平臺(tái)

MqC7_CAAI_1981 ? 來源:YXQ ? 2019-07-02 11:18 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

5月25日-26日,由中國人工智能學(xué)會(huì)主辦,南京市麒麟科技創(chuàng)新園管理委員會(huì)與京東云共同承辦的2019全球人工智能技術(shù)大會(huì)(2019 GAITC)在南京紫金山莊成功舉行。

在第一天的主論壇上,英特爾高級(jí)首席工程師、大數(shù)據(jù)技術(shù)全球 CTO戴金權(quán)發(fā)表了主題為《Analytics Zoo: 統(tǒng)一的大數(shù)據(jù)分析+AI 平臺(tái)》的精彩演講。

戴金權(quán)

英特爾高級(jí)首席工程師、大數(shù)據(jù)技術(shù)全球 CTO

以下是戴總的演講實(shí)錄:

在英特爾如何構(gòu)建統(tǒng)一的大數(shù)據(jù)分析+AI 平臺(tái)(我們稱為開源項(xiàng)目),幫助客戶更高效地開發(fā)大數(shù)據(jù)、大規(guī)模深度學(xué)習(xí)的應(yīng)用。英特爾致力于提供端到端,從設(shè)備端到邊緣,再到數(shù)據(jù)中心云端完整的計(jì)算架構(gòu),比如在數(shù)據(jù)中心,今天英特爾志強(qiáng)服務(wù)器是 AI 應(yīng)用分析的基礎(chǔ)架構(gòu),月提供了多種像神經(jīng)網(wǎng)絡(luò)處理器等豐富的硬件架構(gòu)。同樣在軟件上,我們也是致力于提供全站的解決方案,從最底層的核心算子開源項(xiàng)目可以幫助用戶更高效開發(fā)他們的計(jì)算庫;再到上層各種機(jī)器學(xué)習(xí)或者深度學(xué)習(xí)的框架,比如對(duì)開源的 Analytics Zoo,深度學(xué)習(xí)做了大量的優(yōu)化工作;再到最上層,也提供了一些開源工具包,目的是幫助應(yīng)用開發(fā)人員更高效地開發(fā)基于深度學(xué)習(xí)的應(yīng)用。

今天在這里著重分享的是基于大數(shù)據(jù)分析處理的框架上開發(fā)并且開源的兩個(gè)項(xiàng)目,一個(gè)是 BIGDL,是我們兩年半以前開源的一個(gè)深度學(xué)習(xí)的框架;在這個(gè)基礎(chǔ)上,去年又開源了 Analytics Zoo,構(gòu)建一個(gè)端到端的大數(shù)據(jù)分析 + 深度學(xué)習(xí)的平臺(tái)。為什么在英特爾開發(fā),并且開源基于大數(shù)據(jù)平臺(tái)上的大數(shù)據(jù)分析 +AI 的平臺(tái)工具?

下圖中黑色的小框代表機(jī)器學(xué)習(xí)或者深度學(xué)習(xí)的模型,它很關(guān)鍵,從某種意義上決定了硬件有怎樣的功能,做到怎樣的事情。但是會(huì)發(fā)現(xiàn),當(dāng)想把這樣一個(gè)深度學(xué)習(xí)、機(jī)器學(xué)習(xí)模型應(yīng)用到實(shí)際場景,從實(shí)驗(yàn)室搬到現(xiàn)實(shí)工業(yè)級(jí)機(jī)器學(xué)習(xí)中,構(gòu)建這樣的端到端應(yīng)用是非常復(fù)雜的,要有大量的其他模塊,比如怎樣收集數(shù)據(jù)、處理數(shù)據(jù)和驗(yàn)證數(shù)據(jù),包括資源管理、集群監(jiān)控等。整個(gè)端到端的流水線是由一個(gè)非常多的模塊組成的,一個(gè)端到端大數(shù)據(jù)處理分析再加上深度學(xué)習(xí)、機(jī)器學(xué)習(xí)的流水線。

下圖是我們在兩年前和京東的一個(gè)合作。京東帶來的幾億張圖片,存儲(chǔ)在一個(gè)大規(guī)模分布式大數(shù)據(jù)集群里,我們做的事情是要對(duì)這些圖片——識(shí)別物品。比如,這張圖片上是一只鳥,然后提取特征。從深度學(xué)習(xí)、機(jī)器學(xué)習(xí)來說,不是特別復(fù)雜的應(yīng)用,做物品識(shí)別、提取持證就可以了。但是事實(shí)上發(fā)現(xiàn),在對(duì)大規(guī)模的圖片讀取數(shù)據(jù),對(duì)圖片進(jìn)行分布式處理,再進(jìn)行模型推理;當(dāng)識(shí)別物品時(shí),對(duì)物品進(jìn)行抽取,再進(jìn)行處理,再提取特征等,把整個(gè)端到端流水線在大規(guī)模的圖片里是跑不好的。當(dāng)要把這些機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等技術(shù)應(yīng)用到實(shí)際應(yīng)用中,會(huì)有一個(gè)比較大的斷層,今天很多的科學(xué)家做了非常多的深度學(xué)習(xí)、機(jī)器學(xué)習(xí)的有效工作,但是如何將新技術(shù)、新創(chuàng)新應(yīng)用到現(xiàn)實(shí)環(huán)境中,特別是在一些非常大規(guī)模、大數(shù)據(jù)生產(chǎn)系統(tǒng)中,從軟硬件架構(gòu)上有非常大的一個(gè)斷層。這就是為什么我們會(huì)去開源,像BIGDL,特別是 Analytics Zoo 平臺(tái),能夠?qū)⒉煌哪K不管是用 TensorFlow 還是用Keras,將這些不同模塊的程序能夠無縫運(yùn)行在端到端流水線上,大大提升開發(fā)效率。

總之,我們開發(fā)并且開源的目的是讓大家更加方便開發(fā)大數(shù)據(jù)、大規(guī)模深度學(xué)習(xí)的應(yīng)用。通常很多用戶開始開發(fā)應(yīng)用時(shí),可能在一個(gè)筆記本上構(gòu)建一個(gè)簡單原形,當(dāng)你覺得原形看還不錯(cuò)時(shí),希望可以跑歷史數(shù)據(jù),對(duì)過去幾個(gè)月或者幾年的數(shù)據(jù)進(jìn)行一些驗(yàn)證,為端到端的流水線構(gòu)造原形。在實(shí)驗(yàn)上覺得效果還不錯(cuò),就希望部署到生產(chǎn)系統(tǒng)中,可能進(jìn)行上線。同時(shí)也是大規(guī)模、大數(shù)據(jù)處理的流水線,可以讓你的程序運(yùn)行在一個(gè)大標(biāo)準(zhǔn)集群里,直接利用現(xiàn)有的大數(shù)據(jù)集群、大數(shù)據(jù)計(jì)算資源運(yùn)行你的程序,從而能夠提高你進(jìn)行開發(fā)并且部署深度學(xué)習(xí)應(yīng)用的效率。

有關(guān) Analytics Zoo 一些技術(shù)細(xì)節(jié)的構(gòu)成。總的來說,構(gòu)建在很多不同底層計(jì)算的庫和框架上,在上面構(gòu)建一些豐富的流水線支持;再上面也提供了一些解決方案,包括預(yù)定模型。

下面來看一下具體的例子。有人和我說不要放太多代碼在里面,用 Spark 構(gòu)建一個(gè) RDD,對(duì)大規(guī)模數(shù)據(jù)進(jìn)行分布式處理。對(duì)各種各樣的數(shù)據(jù)源,不管是數(shù)據(jù)倉庫的方式,還是讀寫數(shù)據(jù)庫,或者是讀寫各種各樣的分布式文件系統(tǒng),可以直接使用 Spark Dataframe。下面的圖片是說,如能夠使用剛才訓(xùn)練的模型,就可以使用我們的模型推理進(jìn)行大規(guī)模分布式應(yīng)用,在自己 Keras 等框架內(nèi)都很容易將我們深度學(xué)習(xí)模型集成在這些流水式處理或者在線處理中,而且在這個(gè)背后也可以透明地使用像 Analytics Zoo 的工具,對(duì)模型進(jìn)行壓縮加速,包括至強(qiáng)深度學(xué)習(xí)加速指令對(duì)它進(jìn)行加速;同時(shí)可以跑在大規(guī)模集群上進(jìn)行分布式推理。

我們真正的用戶是怎么具體使用的?解決他們什么問題?下圖是我們和美的的合作,他們希望通過計(jì)算機(jī)視覺將其生產(chǎn)線生產(chǎn)出來的產(chǎn)品自動(dòng)識(shí)別瑕疵、沒有貼標(biāo)簽等。

工業(yè)機(jī)器人接上攝像機(jī),對(duì)流水線出來的產(chǎn)品進(jìn)行拍照,拿到照片后進(jìn)行識(shí)別,產(chǎn)品上是不是有缺陷。比如,下圖中可以看到空調(diào)上少了一個(gè)螺絲。上圖中,粉紅色是對(duì)大規(guī)模圖片進(jìn)行處理;黃色是 SSDLite這樣的一個(gè)模型,使用 Analytics Zoo API和 Spark 數(shù)據(jù)可以整合起來,在 Spark 上進(jìn)行訓(xùn)練。

下面這個(gè)例子是我們和微軟中國團(tuán)隊(duì)的合作,他們希望給大家提供客戶。比如,他們有一個(gè)微信公眾號(hào),在他們的微信公眾號(hào)上可以提問題,如怎么聯(lián)不上我的虛擬機(jī)、怎么重啟我的虛擬機(jī)、怎么開發(fā)票等。原來他們的做法是,在特定領(lǐng)域完成特定任務(wù)的對(duì)話。上午的報(bào)告中有很多專家提到,在垂直領(lǐng)域定義模版。他們有很多定義好的流程,可以隨著流程走?,F(xiàn)在很多人不隨著流程走,隨便問一些問題,怎么開不了發(fā)票?因?yàn)閮?nèi)部有大量知識(shí)庫和準(zhǔn)備好的問答,通過關(guān)鍵詞的匹配可以幫你去搜索,搜索出一些文章,希望滿足你的問題。這里,希望我們幫他做一些問答匹配,把相關(guān)的回答反饋給用戶,用戶看到這些問題后,可能解決了他的問題或者沒有;如果沒有解決,就要轉(zhuǎn)人工處理。轉(zhuǎn)人工處理是非常昂貴的事情,不同的問題要轉(zhuǎn)到不同的后臺(tái),所以要有對(duì)意圖進(jìn)行分類的模塊,將問題做一些分類,到底是財(cái)務(wù)的問題,還是網(wǎng)絡(luò)的問題,還是虛擬機(jī)的問題。

Office Depot,賣辦公用品的一個(gè)電商,做一些產(chǎn)品的推薦,當(dāng)把一個(gè)物品加入到購物車后,根據(jù)你的行為推薦一些相關(guān)的物品。這是一個(gè)跑在云上的應(yīng)用,使用 Spark 和 Analytics Zoo 上進(jìn)行訓(xùn)練,使用 mleap 就可以直接將 pipeline 模型保存下來,訓(xùn)練出來的模型直接部署在 AWS S3,通過 BigDL 把它部署在一個(gè) DNN 進(jìn)行在線推理。

萬事達(dá),希望給大家推送一些促銷信息,到哪里去購物,我給你一個(gè)立減等類似的優(yōu)惠,希望把這些推送到相關(guān)的客戶,客戶收到這些信息后會(huì)買東西。但是有一個(gè)特別的問題,我們會(huì)根據(jù)用戶過去購買行為進(jìn)行分析,將用戶過去的購買行為、交易的數(shù)據(jù)是放在數(shù)據(jù)庫里的,怎樣能夠在Apache Hadoop 現(xiàn)有集群上運(yùn)行這些新的深度學(xué)習(xí)應(yīng)用?這時(shí)就可以使用 Analytics Zoo 深度學(xué)習(xí)框架,可以在現(xiàn)有大數(shù)據(jù)分析集群上,和其他的業(yè)務(wù)共享同一個(gè)集群,來運(yùn)行這些新的深度學(xué)習(xí)應(yīng)用。

CENR,歐洲的盒子研究中心,他們每天都在進(jìn)行每秒大約 4 000 萬原子對(duì)撞,產(chǎn)生 1 TB 數(shù)據(jù),他們希望把這些數(shù)據(jù)存下來;希望有一個(gè)過濾機(jī)制,將有用的事件保留、存儲(chǔ)下來。這樣做可能每秒只存不超過 10 GB 的數(shù)據(jù),這些數(shù)據(jù)可以用于以后的分析。他們希望過濾的越準(zhǔn)確越好,因此分為三種事件,構(gòu)建了一個(gè)深度學(xué)習(xí)模型,通過深度學(xué)習(xí)進(jìn)行學(xué)習(xí)分類,將這些數(shù)據(jù)精確分析,用于以后的工作中。你可以很方便地在 Analytics Zoo 在單機(jī)上進(jìn)行驗(yàn)證,直接運(yùn)行在一個(gè)分布式環(huán)境里進(jìn)行訓(xùn)練,最后訓(xùn)練出結(jié)果。因?yàn)槊棵攵紩?huì)產(chǎn)生 1 TB 數(shù)據(jù),所以需要一個(gè)在線的、類似于像流式處理的平臺(tái),這里他們用了 Spark DataFrame 進(jìn)行在線預(yù)測,對(duì)原子對(duì)撞事件進(jìn)行分類。

怎么應(yīng)用 Analytics Zoo ?比如在阿里云上面部署 EMR,使用 Analytics Zoo。

最后總結(jié)一下。我們之所以構(gòu)建Analytics Zoo 這樣的統(tǒng)計(jì)大數(shù)據(jù)分析 +AI平臺(tái),就是希望能夠讓用戶在現(xiàn)實(shí)的生產(chǎn)環(huán)境中可以更方便構(gòu)架深度學(xué)習(xí)的應(yīng)用,將各種不同的模塊、不同的框架下統(tǒng)一到一個(gè)端到端流水線上,大大提高客戶開發(fā)部署大數(shù)據(jù)分析和深度學(xué)習(xí)的能力。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    37065

    瀏覽量

    290352
  • 阿里云
    +關(guān)注

    關(guān)注

    3

    文章

    1024

    瀏覽量

    45293

原文標(biāo)題:演講實(shí)錄丨戴金權(quán) Analytics Zoo: 統(tǒng)一的大數(shù)據(jù)分析+AI 平臺(tái)

文章出處:【微信號(hào):CAAI-1981,微信公眾號(hào):中國人工智能學(xué)會(huì)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    【產(chǎn)品介紹】Altair RapidMiner數(shù)據(jù)分析與人工智能平臺(tái)

    AltairRapidMiner賦能組織解鎖數(shù)據(jù)洞察,運(yùn)用數(shù)據(jù)分析和先進(jìn)的人工智能自動(dòng)化,提供可擴(kuò)展的面向未來的解決方案。Altair數(shù)據(jù)分析和人工智能平臺(tái)包括
    的頭像 發(fā)表于 09-18 17:56 ?471次閱讀
    【產(chǎn)品介紹】Altair RapidMiner<b class='flag-5'>數(shù)據(jù)分析</b>與人工智能<b class='flag-5'>平臺(tái)</b>

    電磁兼容與電磁干擾在電磁兼容性大數(shù)據(jù)分析中的智能管理系統(tǒng)

    數(shù)據(jù),結(jié)合大數(shù)據(jù)分析、流程自動(dòng)化及云邊協(xié)同技術(shù),實(shí)現(xiàn)電磁環(huán)境全生命周期管理。以下從五大維度精簡解析: 應(yīng)用案例 北京華盛恒輝、北京五木恒潤研發(fā)的 EMC/EMI 智能管理系統(tǒng)已落地應(yīng)用,成效顯著,為系統(tǒng)推廣提供有力支撐。 、
    的頭像 發(fā)表于 09-17 14:58 ?320次閱讀

    電磁兼容與電磁干擾在電磁兼容性大數(shù)據(jù)分析中的智能管理平臺(tái)

    電磁兼容與電磁干擾在電磁兼容性大數(shù)據(jù)分析中的智能管理系統(tǒng)
    的頭像 發(fā)表于 09-17 14:58 ?271次閱讀
    電磁兼容與電磁干擾在電磁兼容性<b class='flag-5'>大數(shù)據(jù)分析</b>中的智能管理<b class='flag-5'>平臺(tái)</b>

    電磁兼容與電磁干擾在電磁兼容性大數(shù)據(jù)分析中的智能管理系統(tǒng)

    電磁兼容與電磁干擾在電磁兼容性大數(shù)據(jù)分析中的智能管理系統(tǒng)
    的頭像 發(fā)表于 09-17 14:42 ?419次閱讀
    電磁兼容與電磁干擾在電磁兼容性<b class='flag-5'>大數(shù)據(jù)分析</b>中的智能管理系統(tǒng)

    普迪飛 Exensio?數(shù)據(jù)分析平臺(tái) | Test Operations解鎖半導(dǎo)體測試新紀(jì)元

    TestOperations是Exensio數(shù)據(jù)分析平臺(tái)的四個(gè)主要模塊之。T-Ops模塊旨在幫助集成器件制造商(IDM)、無晶圓廠半導(dǎo)體公司(Fabless)和外包半導(dǎo)體(產(chǎn)品)封測廠(OSAT
    的頭像 發(fā)表于 08-19 13:53 ?605次閱讀
    普迪飛 Exensio?<b class='flag-5'>數(shù)據(jù)分析</b><b class='flag-5'>平臺(tái)</b> | Test Operations解鎖半導(dǎo)體測試新紀(jì)元

    AI數(shù)據(jù)分析儀設(shè)計(jì)原理圖:RapidIO信號(hào)接入 平板AI數(shù)據(jù)分析

    AI數(shù)據(jù)分析儀, 平板數(shù)據(jù)分析儀, 數(shù)據(jù)分析儀, AI邊緣計(jì)算, 高帶寬數(shù)據(jù)輸入
    的頭像 發(fā)表于 07-17 09:20 ?371次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>數(shù)據(jù)分析</b>儀設(shè)計(jì)原理圖:RapidIO信號(hào)接入 平板<b class='flag-5'>AI</b><b class='flag-5'>數(shù)據(jù)分析</b>儀

    TDengine 發(fā)布時(shí)序數(shù)據(jù)分析 AI 智能體 TDgpt,核心代碼開源

    2025 年 3 月 26 日,濤思數(shù)據(jù)通過線上直播形式正式發(fā)布了其新代時(shí)序數(shù)據(jù)分析 AI 智能體——TDgpt,并同步開源其核心代碼。這
    的頭像 發(fā)表于 03-27 10:30 ?479次閱讀
    TDengine 發(fā)布時(shí)序<b class='flag-5'>數(shù)據(jù)分析</b> <b class='flag-5'>AI</b> 智能體 TDgpt,核心代碼開源

    數(shù)據(jù)可視化與數(shù)據(jù)分析的關(guān)系

    的含義。 數(shù)據(jù)分析的定義與作用 數(shù)據(jù)分析種使用統(tǒng)計(jì)和邏輯方法來分析數(shù)據(jù)集的過程,目的是發(fā)現(xiàn)模式、趨勢和關(guān)聯(lián)性。它包括
    的頭像 發(fā)表于 12-06 17:09 ?1253次閱讀

    LLM在數(shù)據(jù)分析中的作用

    隨著大數(shù)據(jù)時(shí)代的到來,數(shù)據(jù)分析已經(jīng)成為企業(yè)和組織決策的關(guān)鍵工具。數(shù)據(jù)科學(xué)家和分析師需要從海量數(shù)據(jù)中提取有價(jià)值的信息,以支持業(yè)務(wù)決策。在這個(gè)過
    的頭像 發(fā)表于 11-19 15:35 ?1462次閱讀

    eda與傳統(tǒng)數(shù)據(jù)分析的區(qū)別

    EDA(Exploratory Data Analysis,探索性數(shù)據(jù)分析)與傳統(tǒng)數(shù)據(jù)分析之間存在顯著的差異。以下是兩者的主要區(qū)別: 、分析目的和方法論 EDA 目的 :EDA的主要
    的頭像 發(fā)表于 11-13 10:52 ?1127次閱讀

    AI項(xiàng)目管理平臺(tái)怎么用

    AI項(xiàng)目管理平臺(tái)種集成了項(xiàng)目管理工具、AI開發(fā)環(huán)境和數(shù)據(jù)分析能力的綜合性平臺(tái)。接下來,
    的頭像 發(fā)表于 11-13 09:38 ?926次閱讀

    raid 在大數(shù)據(jù)分析中的應(yīng)用

    的具體應(yīng)用: 、提高性能 并行讀寫 :RAID技術(shù)通過并行讀寫多個(gè)磁盤,可以顯著提高數(shù)據(jù)的讀寫速度。在大數(shù)據(jù)分析環(huán)境中,數(shù)據(jù)讀寫速度是影響分析
    的頭像 發(fā)表于 11-12 09:44 ?939次閱讀

    emc技術(shù)在大數(shù)據(jù)分析中的角色

    在當(dāng)今這個(gè)數(shù)據(jù)驅(qū)動(dòng)的世界中,大數(shù)據(jù)分析已經(jīng)成為企業(yè)獲取洞察力、優(yōu)化業(yè)務(wù)流程和提高競爭力的關(guān)鍵工具。隨著數(shù)據(jù)量的爆炸性增長,企業(yè)面臨著如何有效存儲(chǔ)、處理和分析這些
    的頭像 發(fā)表于 11-01 15:22 ?907次閱讀

    云計(jì)算在大數(shù)據(jù)分析中的應(yīng)用

    云計(jì)算在大數(shù)據(jù)分析中的應(yīng)用廣泛且深入,它為用戶提供了存儲(chǔ)、計(jì)算、分析和預(yù)測的強(qiáng)大能力。以下是對(duì)云計(jì)算在大數(shù)據(jù)分析中應(yīng)用的介紹: 、存儲(chǔ)和處理海量數(shù)
    的頭像 發(fā)表于 10-24 09:18 ?1395次閱讀

    使用AI大模型進(jìn)行數(shù)據(jù)分析的技巧

    使用AI大模型進(jìn)行數(shù)據(jù)分析的技巧涉及多個(gè)方面,以下是些關(guān)鍵的步驟和注意事項(xiàng): 、明確任務(wù)目標(biāo)和需求 在使用AI大模型之前,首先要明確
    的頭像 發(fā)表于 10-23 15:14 ?3516次閱讀