chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA GPU再創(chuàng)壯舉,距真正會話AI又進一步!

張慧娟 ? 來源:電子發(fā)燒友網(wǎng) ? 作者:張慧娟 ? 2019-08-15 07:55 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群


會話 AI 服務已經(jīng)存在多年,但不論是聊天機器人,還是智能個人助理或搜索引擎,其理解能力很難達到與人類相當?shù)乃健?strong>主要瓶頸則在于超大型AI模型的實施部署無法實現(xiàn)。正因如此,不論是Google、Microsoft、Facebook,還是阿里巴巴、百度等,都在模型的部署方面孜孜以求。

NVIDIA于太平洋時間8月13日宣布重大突破:BERT訓練時間實現(xiàn)創(chuàng)紀錄的53分鐘,推理時間縮短至2毫秒,并構(gòu)建了迄今為止同類型中最大的語言模型,使得實時會話 AI與用戶進行互動時更為自然。

超大模型面前,GPU再證強大可擴展性

BERT(Bidirectional Encoder Representations from Transformers)是世界上最先進的AI語言模型之一,Google于去年發(fā)布不久就刷爆AI業(yè)界。作為一種新型的語言模型,它只需一個額外的輸出層對預訓練BERT進行微調(diào)就可以滿足各種任務,而無需再對模型進行修改,實現(xiàn)了在11項NLP任務上取得突破進展。

在對BERT模型進行訓練時,NVIDIA使用搭載了92臺 NVIDIA DGX-2H系統(tǒng)的 NVIDIA DGX SuperPOD運行該模型的大型版本,憑借1472個NVIDIA V100 GPU的強大性能,NVIDIA將BERT-Large的典型訓練時間從幾天縮短至僅僅 53 分鐘。

此外,NVIDIA還在單獨一臺NVIDIA DGX-2系統(tǒng)上執(zhí)行了BERT-Large 模型的訓練任務,用時也僅為 2.8天,充分體現(xiàn)了GPU在會話 AI 方面的可擴展性。

推理方面,借助于運行了NVIDIA TensorRT的NVIDIA T4 GPU,NVIDIA 執(zhí)行 BERT-Base SQuAD數(shù)據(jù)集的推理任務,用時僅為2.2毫秒,遠低于許多實時應用程序所需的10毫秒處理閾值;與使用高度優(yōu)化的CPU代碼時所測得的40多毫秒相比,有著顯著改進。

對此,NVIDIA 深度學習應用研究副總裁 Bryan Catanzaro 表示,“對于適用于自然語言的AI而言,大型語言模型正在為其帶來革新。NVIDIA 所取得的突破性工作成果加速了這些模型的創(chuàng)建,它們能夠幫助解決那些最為棘手的語言問題,讓我們距離實現(xiàn)真正的會話 AI 更進了一步

NVIDIA BERT推理解決方案Faster Transformer宣布開源

開發(fā)者們對于更大模型的需求正在日益增長,NVIDIA 研究團隊基于Transformer構(gòu)建并訓練了世界上最大的語言模型。Transformer是BERT的技術構(gòu)件,正被越來越多的其他自然語言AI模型所使用。NVIDIA定制的模型包含83億個參數(shù),是BERT-Large的24 倍

2017年12月Google在論文“Attention is All You Need”中首次提出了Transformer,將其作為一種通用高效的特征抽取器。至今,Transformer已經(jīng)被多種NLP模型采用,比如BERT以及上月發(fā)布重刷其記錄的XLNet,這些模型在多項NLP任務中都有突出表現(xiàn)。在NLP之外,TTS、ASR等領域也在逐步采用Transformer??梢灶A見,Transformer這個簡潔有效的網(wǎng)絡結(jié)構(gòu)會像CNN和RNN一樣被廣泛采用。

不過,雖然Transformer在多種場景下都有優(yōu)秀表現(xiàn),但是在推理部署階段,其計算性能卻受到了巨大的挑戰(zhàn):以BERT為原型的多層Transformer模型,其性能常常難以滿足在線業(yè)務對于低延遲(保證服務質(zhì)量)和高吞吐(考慮成本)的要求。以BERT-BASE為例,超過90%的計算時間消耗在12層Transformer的前向計算上。因此,一個高效的Transformer 前向計算方案,既可以為在線業(yè)務帶來降本增效的作用,也有利于以Transformer結(jié)構(gòu)為核心的各類網(wǎng)絡在更多實際工業(yè)場景中落地。

NVIDIA GPU計算專家團隊針對Transformer推理提出的性能優(yōu)化方案Faster Transformer宣布開源,其底層基于CUDA和cuBLAS,是一個BERT Transformer 單層前向計算的高效實現(xiàn),其代碼簡潔明了,后續(xù)可以通過簡單修改支持多種Transformer結(jié)構(gòu)。目前優(yōu)化集中在編碼器(encoder)的前向計算(解碼器decoder開發(fā)在后續(xù)特性規(guī)劃中),能夠助力于多種BERT的應用場景。Faster Transformer對外提供C++ APITensorFlow OP 接口,以及TensorRT插件,并提供了相應的示例,用以支持用戶將其集成到不同的線上應用代碼中。

2021年15%的客服互動將通過AI完成

預計未來幾年,基于自然語言理解的 AI 服務將呈指數(shù)級增長。根據(jù)Juniper Research 的研究表明,在未來4年中,僅數(shù)字語音助手的數(shù)量就將有望從25 億攀升到 80 億。此外,據(jù)Gartner預計,到 2021 年,15%的客服互動都將通過AI完成,相比2017年將增長4倍。

當前,全球數(shù)以百計的開發(fā)者都使用 NVIDIA 的 AI 平臺,來推進他們自己的語言理解研究并創(chuàng)建新的服務。

Microsoft Bing正在通過先進的 AI 模型和計算平臺,為客戶提供更好的搜索體驗。通過與 NVIDIA 密切合作,Bing 使用 NVIDIA GPU(Azure AI 基礎設施的一部分)進一步優(yōu)化了熱門自然語言模型 BERT 的推理功能,從而大幅提升了 Bing 于去年部署的排名搜索的搜索質(zhì)量。與基于 CPU 的平臺相比,使用 Azure NVIDIA GPU 進行推理,延遲降低了一半,吞吐量提升了5倍。

多家初創(chuàng)公司(例如Clinc、Passage AI 和Recordsure等)正在使用 NVIDIA的AI平臺為銀行、汽車制造商、零售商、醫(yī)療服務提供商、旅行社和酒店等客戶構(gòu)建先進的會話 AI 服務。據(jù)悉,中國市場也有相應的合作伙伴,日后將進一步公開。

會話AI才是真正意義上的人工智能的基本特征,不論是語言模型還是訓練、推理,底層技術的逐步強大,才是實現(xiàn)這一切的基礎。距離我們所期望的人工智能雖然還很遙遠,但技術上的每一次突破都值得記載。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5496

    瀏覽量

    109119
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5102

    瀏覽量

    134487
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    BlackBerry QNX與芯馳科技進一步深化戰(zhàn)略合作

    BlackBerry有限公司(紐約證券交易所代碼:BB;多倫多證券交易所代碼:BB)旗下業(yè)務部門QNX與中國創(chuàng)新汽車半導體供應商芯馳科技今日宣布,雙方將進一步深化合作,基于芯馳科技最新代X10
    的頭像 發(fā)表于 12-04 16:42 ?1497次閱讀

    BlackBerry QNX與眾森軟件進一步深化戰(zhàn)略合作

    今日,深圳市眾森軟件有限公司(以下簡稱"眾森軟件")正式宣布與全球領先的實時操作系統(tǒng)與嵌入式軟件供應商 QNX(BlackBerry有限公司旗下部門QNX)進一步深化戰(zhàn)略合作。此次合作將進一步推動下代智能網(wǎng)聯(lián)汽車與智慧出行解決
    的頭像 發(fā)表于 12-04 16:40 ?1653次閱讀

    上汽奧迪與創(chuàng)維汽車智能合作進一步深化升級

    近日,創(chuàng)維汽車智能迎來重要突破:上汽奧迪客戶將當前公司開發(fā)的顯示屏項目沿用至上汽奧迪其他主力車型。這決定不僅體現(xiàn)了客戶對創(chuàng)維汽車智能技術實力與服務品質(zhì)的高度認可,更標志著雙方合作進一步深化升級。
    的頭像 發(fā)表于 11-25 10:32 ?468次閱讀

    NVIDIA DGX Spark助力構(gòu)建自己的AI模型

    2025 年 1 月 6 日,NVIDIA 正式宣布其 Project DIGITS 項目,并于 3 月 18 日更名為 NVIDIA DGX Spark,進一步公布了產(chǎn)品細節(jié)。DGX Spark
    的頭像 發(fā)表于 11-21 09:25 ?601次閱讀
    <b class='flag-5'>NVIDIA</b> DGX Spark助力構(gòu)建自己的<b class='flag-5'>AI</b>模型

    通過NVIDIA Jetson AGX Thor實現(xiàn)7倍生成式AI性能

    Jetson Thor 平臺還支持多種主流量化格式,包括 NVIDIA Blackwell GPU 架構(gòu)的新 NVFP4 格式,有助于進一步優(yōu)化推理性能。該平臺同時支持推測解碼等新技術,為在邊緣端加速生成式
    的頭像 發(fā)表于 10-29 16:53 ?1081次閱讀

    美國 | FCC即將通過新規(guī),進一步封堵華為、??低?/a>

    FCC即將通過新規(guī),進一步封堵華為、??低?025年10月7日,美國聯(lián)邦通信委員會(FCC)主席宣布,F(xiàn)CC委員會即將投票表決項新規(guī),旨在填補現(xiàn)有法規(guī)中可能被利用的兩大漏洞,以阻止存在“風險
    的頭像 發(fā)表于 10-13 18:11 ?453次閱讀
    美國 | FCC即將通過新規(guī),<b class='flag-5'>進一步</b>封堵華為、??低? />    </a>
</div>                              <div   id=

    蔚來進一步拓展其全球業(yè)務

    8月18日,蔚來公司宣布將于2025年至2026年期間陸續(xù)進入新加坡、烏茲別克斯坦和哥斯達黎加三個市場,進一步拓展其全球業(yè)務,為當?shù)赜脩魩韯?chuàng)新、可持續(xù)、高品質(zhì)的智能電動出行體驗。
    的頭像 發(fā)表于 08-20 17:00 ?1138次閱讀

    軟通動力與中國聯(lián)通合作關系進一步深化

    近日,軟通動力成功中標聯(lián)通(廣東)產(chǎn)業(yè)互聯(lián)網(wǎng)有限公司2025年軟件技術開發(fā)集中采購項目,中標份額位列榜首。這突破性成果,不僅彰顯了軟通動力在數(shù)字技術服務領域的綜合實力,也標志著其與中國聯(lián)通合作關系的進一步深化。
    的頭像 發(fā)表于 07-01 09:18 ?961次閱讀

    NVIDIA虛擬GPU 18.0版本的亮點

    生產(chǎn)力、安全性和性能。新版軟件可幫助企業(yè)和開發(fā)者進一步推動創(chuàng)新、改變工作流并更大限度地發(fā)揮加速計算的潛力。
    的頭像 發(fā)表于 04-07 11:28 ?1149次閱讀

    使用NVIDIA RTX PRO Blackwell系列GPU加速AI開發(fā)

    NVIDIA GTC 推出新代專業(yè)級 GPUAI 賦能的開發(fā)者工具—同時,ChatRTX 更新現(xiàn)已支持 NVIDIA NIM,RTX
    的頭像 發(fā)表于 03-28 09:59 ?1085次閱讀

    三星攜Galaxy AI和以軟件為中心的網(wǎng)絡技術亮相MWC 2025,進一步強化移動AI領先優(yōu)勢

    3月3日-6日,世界移動通信大會(MWC2025)在巴塞羅那 Fira Gran Via展館舉行。本次大會上,三星電子進一步創(chuàng)新移動AI體驗,三星移動業(yè)務和網(wǎng)絡業(yè)務部門在現(xiàn)場展示了旗下包括下
    的頭像 發(fā)表于 03-05 15:43 ?613次閱讀
    三星攜Galaxy <b class='flag-5'>AI</b>和以軟件為中心的網(wǎng)絡技術亮相MWC 2025,<b class='flag-5'>進一步</b>強化移動<b class='flag-5'>AI</b>領先優(yōu)勢

    迅為2K0300開發(fā)板進一步刨析,打造HMI體機產(chǎn)品的靈活優(yōu)勢

    迅為2K0300開發(fā)板進一步刨析,打造HMI體機產(chǎn)品的靈活優(yōu)勢
    的頭像 發(fā)表于 02-26 13:58 ?1048次閱讀
    迅為2K0300開發(fā)板<b class='flag-5'>進一步</b>刨析,打造HMI<b class='flag-5'>一</b>體機產(chǎn)品的靈活優(yōu)勢

    NVIDIA RTX AI PC如何解鎖AI智能體

    生成式 AI 改變了人們將創(chuàng)意變?yōu)楝F(xiàn)實的方式。代理式 AI 進一步推進了這進程 — 利用復雜的自主因果推理和迭代式規(guī)劃來幫助解決復雜的多步驟問題。
    的頭像 發(fā)表于 01-18 10:10 ?924次閱讀
    <b class='flag-5'>NVIDIA</b> RTX <b class='flag-5'>AI</b> PC如何解鎖<b class='flag-5'>AI</b>智能體

    NVIDIA推出多個生成式AI模型和藍圖

    NVIDIA 宣布推出多個生成式 AI 模型和藍圖,將 NVIDIA Omniverse 體化進一步擴展至物理
    的頭像 發(fā)表于 01-08 10:48 ?1041次閱讀

    NVIDIA和GeForce RTX GPU專為AI時代打造

    NVIDIA 和 GeForce RTX GPU 專為 AI 時代打造。
    的頭像 發(fā)表于 01-06 10:45 ?1274次閱讀