chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英偉達(dá)推出實(shí)時(shí)對(duì)話式AI模型工具

我快閉嘴 ? 來(lái)源:智東西 ? 作者:心緣 ? 2021-03-02 10:06 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

憑借聽(tīng)、讀、譯三大功能,對(duì)話式人工智能AI)正逐漸深入人們的生活,成為解放雙手和提高生產(chǎn)力的關(guān)鍵工具。

當(dāng)你說(shuō)話時(shí),對(duì)話式AI能實(shí)時(shí)將你說(shuō)的話記錄成文字,甚至可以實(shí)時(shí)翻譯成其他語(yǔ)言。

當(dāng)你聽(tīng)不懂、記不住醫(yī)生叮囑的藥物或治療方案時(shí),接受過(guò)海量醫(yī)學(xué)文本訓(xùn)練的對(duì)話式AI,能幫你準(zhǔn)確地記下全部醫(yī)囑。

當(dāng)你因?yàn)殚_(kāi)車(chē)等原因不方便看手機(jī)時(shí),對(duì)話式AI能將屏幕上的文字讀給你聽(tīng)。

它既能做穩(wěn)定的速記員,也能勝任專業(yè)的翻譯官,越來(lái)越多企業(yè)采用對(duì)話式AI來(lái)改善工作效率與優(yōu)化客戶支持。

不過(guò),要開(kāi)發(fā)出一款優(yōu)質(zhì)的對(duì)話式AI,并不是一件容易的事。如果只追求最快的響應(yīng)速度,難免犧牲語(yǔ)音識(shí)別、語(yǔ)言理解、語(yǔ)音生成的質(zhì)量,而如果過(guò)于重視質(zhì)量,可能會(huì)響應(yīng)的不夠及時(shí)。

怎樣能快速開(kāi)發(fā)出高質(zhì)量的對(duì)話式AI,滿足專業(yè)的轉(zhuǎn)錄和編譯需求?知名硅谷芯片巨頭NVIDIA剛剛推出了一個(gè)相當(dāng)有用的工具。

一、降低實(shí)時(shí)對(duì)話式AI開(kāi)發(fā)門(mén)檻的神器

2020年初突然爆發(fā)的新冠肺炎疫情正刺激企業(yè)AI的應(yīng)用,從遠(yuǎn)程教育、遠(yuǎn)程辦公、客戶服務(wù)到醫(yī)療健康,眾多行業(yè)加速出現(xiàn)對(duì)AI的需求。

知名市場(chǎng)調(diào)研機(jī)構(gòu)IDC的數(shù)據(jù)顯示,2019年中國(guó)對(duì)話式AI的支出約為58億美元,這一數(shù)字有望到2023年攀升至138億美元。其中,中國(guó)對(duì)話式AI市場(chǎng)規(guī)模有望從2019年的5.761億美元增至2023年的18.593億美元,年均復(fù)合增長(zhǎng)率(CAGR)為34.0%。

什么是對(duì)話式AI?簡(jiǎn)單理解,就是一種能自動(dòng)理解人類(lèi)語(yǔ)言的系統(tǒng),使得人與機(jī)器的交流像人與人之間的交流那樣輕松、自然而高效。

想想我們的日常溝通過(guò)程,我們不會(huì)向?qū)Ψ桨l(fā)出固定的指令,而是用自然的語(yǔ)言進(jìn)行交流。

而要讓機(jī)器更加自然、擬人化的與人類(lèi)互動(dòng),需要先讓機(jī)器理解你所說(shuō)的話,即時(shí)了解上下文和語(yǔ)言,判斷話的意圖和隱藏含義,并以最自然的對(duì)話方式做出回應(yīng)。

在疫情刺激下,英國(guó)高性能語(yǔ)音識(shí)別服務(wù)供應(yīng)商Intelligent Voice發(fā)展勢(shì)頭相當(dāng)迅猛,幾個(gè)月內(nèi)即推出了新產(chǎn)品Myna,能連接到虛擬會(huì)議工具,自動(dòng)記錄、將錄音轉(zhuǎn)換成文本并發(fā)送文本記錄。

Myna得以快速實(shí)現(xiàn)的秘密武器,即是NVIDIA去年5月首次公布的實(shí)時(shí)對(duì)話式AI模型工具Jarvis。

Jarvis是一個(gè)基于NVIDIA GPU提供實(shí)時(shí)性能的靈活、多模態(tài)對(duì)話式AI服務(wù)應(yīng)用框架。

“Jarvis采用多模態(tài)的方法,將自動(dòng)語(yǔ)音識(shí)別的關(guān)鍵元素與實(shí)體和意圖匹配相融合,滿足需要高吞吐量和低延遲的新用例的需求。Jarvis API不但易于使用,還能整合和自定義客戶的工作流程,實(shí)現(xiàn)性能優(yōu)化?!盜ntelligent Voice首席技術(shù)官Nigel Cannings說(shuō)。

另一家創(chuàng)建阿拉伯語(yǔ)虛擬助手的公司InstaDeep同樣是Jarvis的早期采用者。通過(guò)Jarvis中的NeMo工具包,這家公司對(duì)阿拉伯語(yǔ)語(yǔ)音–文本模型進(jìn)行微調(diào),將單詞錯(cuò)誤率降低至7.84%。

通過(guò)早期采用者的反饋與優(yōu)化,Jarvis逐漸實(shí)現(xiàn)了更高的吞吐量和更低的延遲。在打磨成熟后,NVIDIA于昨日正式推出GPU加速的Jarvis 1. 0公測(cè)版。

二、延時(shí)小于300毫秒,開(kāi)發(fā)速度提升高達(dá)10倍

Jarvis 1. 0公測(cè)版中包含用于構(gòu)建和部署實(shí)時(shí)對(duì)話式AI應(yīng)用程序的端到端工作流程,使開(kāi)發(fā)者能輕松實(shí)現(xiàn)實(shí)時(shí)語(yǔ)音識(shí)別、轉(zhuǎn)錄、翻譯、封閉式字幕、虛擬助手和聊天機(jī)器人等功能。

它對(duì)于改善企業(yè)服務(wù)非常友好。如果從頭開(kāi)始構(gòu)建對(duì)話式AI服務(wù),必然需要深厚的AI專業(yè)知識(shí)、海量數(shù)據(jù)和充足的計(jì)算資源,而由NVIDIA GPU加速的Jarvis框架使開(kāi)發(fā)者無(wú)需為這些成本而煩憂。

Jarvis的一大能力是定制解決方案。基于NVIDIA Jarvis,企業(yè)開(kāi)發(fā)者能很容易地用專有的視頻和語(yǔ)音數(shù)據(jù),對(duì)最新模型進(jìn)行微調(diào),從而更深入地理解特定上下文,并對(duì)推理進(jìn)行優(yōu)化,從而構(gòu)建針對(duì)其自身行業(yè)、產(chǎn)品和客戶特征而量身定制的高質(zhì)量、端到端實(shí)時(shí)對(duì)話式AI服務(wù)。

這些服務(wù)運(yùn)行時(shí)間不到300毫秒,在GPU上的吞吐量比CPU高7倍。

首先是自動(dòng)語(yǔ)音識(shí)別(ASR),整個(gè)系統(tǒng)需要先輸入音頻、提取特征,用聲學(xué)模型嘗試找出特定聲音生成相應(yīng)的等效詞,從而識(shí)別語(yǔ)音音頻并生成對(duì)應(yīng)文本;然后借助Jarvis,可以實(shí)現(xiàn)機(jī)器翻譯、搜索、意圖識(shí)別、語(yǔ)言分析、問(wèn)答系統(tǒng)等自然語(yǔ)言理解(NLU)服務(wù);最后從這些服務(wù)獲得文本作為輸出,通過(guò)語(yǔ)音合成(TTS)技術(shù)和語(yǔ)音編碼模塊生成像人類(lèi)聲音的對(duì)應(yīng)語(yǔ)音。

此次發(fā)布的Jarvis提供有多個(gè)新型對(duì)話式AI預(yù)訓(xùn)練模型,包括基于數(shù)千小時(shí)語(yǔ)音數(shù)據(jù)訓(xùn)練的ASR、NLU和TTS模型,提供使用一行代碼部署服務(wù)的端到端工作流程和工具,并支持遷移學(xué)習(xí)工具包(TLT),方便企業(yè)根據(jù)自己的具體用例和領(lǐng)域調(diào)整應(yīng)用。

其遷移學(xué)習(xí)工具包是一個(gè)拖放界面,不需要任何先驗(yàn)編碼經(jīng)驗(yàn),即可采用自定義數(shù)據(jù)通過(guò)零編碼的方法,快速重新訓(xùn)練模型。

開(kāi)發(fā)者可以再訓(xùn)練TLT,也可以探索用于構(gòu)建和訓(xùn)練GPU加速的對(duì)話式AI模型的Python工具包NeMo,然后用Jarvis集成使用最先進(jìn)的AI語(yǔ)言模型進(jìn)行語(yǔ)音識(shí)別、語(yǔ)音合成、語(yǔ)義理解的虛擬助手,未來(lái)Jarvis還將支持計(jì)算機(jī)視覺(jué)服務(wù)。

通過(guò)Jarvis,企業(yè)可以獲得各種先進(jìn)的模型、通過(guò)TLT遷移學(xué)習(xí)將開(kāi)發(fā)速度提升高達(dá)10倍,以及全面優(yōu)化的GPU加速流程,從而創(chuàng)建能理解每家公司獨(dú)特專業(yè)術(shù)語(yǔ)的實(shí)時(shí)智能語(yǔ)言型應(yīng)用。

其全面加速的深度學(xué)習(xí)流程經(jīng)過(guò)優(yōu)化,可作為可擴(kuò)展服務(wù)運(yùn)行。

即日起,NVIDIA Jarvis和TLT可供NVIDIA開(kāi)發(fā)者計(jì)劃成員免費(fèi)下載。

三、對(duì)話式AI正改變各行業(yè)服務(wù)體驗(yàn)

NVIDIA Jarvis服務(wù)現(xiàn)有的三大功能分別是語(yǔ)音識(shí)別、語(yǔ)音合成、自然語(yǔ)言理解。

其語(yǔ)音識(shí)別服務(wù)有不同的模式選擇,可以使用不同采樣率,可用于語(yǔ)音識(shí)別的英語(yǔ)語(yǔ)音數(shù)據(jù)已經(jīng)被訓(xùn)練了7000個(gè)小時(shí),并提供有Jasper、Quartznet等不同聲學(xué)模型,全流程端到端優(yōu)化。

其語(yǔ)音合成有流模式和批處理模式,支持22kHz采樣率,提供acoTron2、Waveglow等模型和完全端到端優(yōu)化的流程。

如果要識(shí)別特定領(lǐng)域的實(shí)體,Jarvis的自然語(yǔ)言理解模型即可提供幫助,該服務(wù)提供高級(jí)NLP API和低級(jí)API,能滿足命名實(shí)體識(shí)別、領(lǐng)域分類(lèi)、分別標(biāo)簽等需要。

例如,在醫(yī)療健康領(lǐng)域,眼科醫(yī)生進(jìn)行遠(yuǎn)程診療時(shí),自然語(yǔ)言理解服務(wù)能識(shí)別醫(yī)學(xué)文本的實(shí)體,在對(duì)話過(guò)程中能檢測(cè)出哪些醫(yī)療實(shí)體,輔助終端系統(tǒng)為患者進(jìn)行診斷。

除了醫(yī)療健康外,NVIDIA Jarvis也正為政務(wù)、金融、消費(fèi)者服務(wù)等更多行業(yè)帶來(lái)新的機(jī)遇。

企業(yè)和政府機(jī)構(gòu)每天都要記錄數(shù)以千萬(wàn)計(jì)的通話,但通過(guò)搜索提取這些通話中的關(guān)鍵信息幾乎難以實(shí)現(xiàn)。而通過(guò)Jarvis把錄音轉(zhuǎn)換成文本,就可以利用AI工具快速搜索并分析這些數(shù)據(jù)。

在金融領(lǐng)域,以用AI顛覆金融分析行業(yè)而聞名的英國(guó)公司Kensho用NVIDIA對(duì)話式AI開(kāi)發(fā)了金融和商業(yè)語(yǔ)音識(shí)別解決方案Scribe,該方案據(jù)稱在財(cái)報(bào)電話和財(cái)務(wù)音頻方面的準(zhǔn)確率比同類(lèi)其他商業(yè)解決方案高出約20%。

得益于在推薦引擎Merlin、對(duì)話式AI Jarvis等關(guān)鍵框架的押注,NVIDIA正不斷強(qiáng)化其數(shù)據(jù)中心業(yè)務(wù)的軟件優(yōu)勢(shì)。

本周NVIDIA剛剛公布的最新財(cái)報(bào)顯示,其數(shù)據(jù)中心業(yè)務(wù)在截至2021年1月31日的第四季度創(chuàng)下19億美元收入新紀(jì)錄,同比增長(zhǎng)97%,全年收入創(chuàng)下67.0億美元的紀(jì)錄,同比增長(zhǎng)124%。

結(jié)語(yǔ):加速對(duì)話式AI落地普及

通過(guò)虛擬助手、實(shí)時(shí)轉(zhuǎn)錄、聊天機(jī)器人等形態(tài),對(duì)話式AI正帶給企業(yè)客戶更多沉浸式的體驗(yàn)。

隨著越來(lái)越多企業(yè)及消費(fèi)者擁抱數(shù)字化,更多中小型機(jī)構(gòu)也開(kāi)始在其聯(lián)絡(luò)中心部署更具個(gè)性化的對(duì)話式AI功能,而開(kāi)發(fā)部署的成本與復(fù)雜性,往往是制約這一趨勢(shì)的核心難題之一。

而NVIDIA Jarvis 1. 0公測(cè)版的推出,降低了實(shí)時(shí)對(duì)話式AI開(kāi)發(fā)的準(zhǔn)入門(mén)檻,有望推動(dòng)未來(lái)對(duì)話式AI在更多行業(yè)的普及落地。
責(zé)任編輯:tzh

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 芯片
    +關(guān)注

    關(guān)注

    462

    文章

    53252

    瀏覽量

    455455
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5444

    瀏覽量

    108606
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    37213

    瀏覽量

    292012
  • 人工智能
    +關(guān)注

    關(guān)注

    1813

    文章

    49536

    瀏覽量

    259371
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    英偉達(dá)重磅殺入Arm AI PC,N1X芯片跑分曝光!結(jié)果比較意外

    ?電子發(fā)燒友網(wǎng)報(bào)道(文/黃山明)如今我們正處于信息時(shí)代邁入AI時(shí)代的過(guò)渡期,而作為AI時(shí)代最大的“賣(mài)鏟人”,英偉達(dá)算是吃盡了時(shí)代的紅利。不僅將公司一舉帶上了全球第一的市值,更是讓
    的頭像 發(fā)表于 03-04 00:58 ?2960次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>重磅殺入Arm <b class='flag-5'>AI</b> PC,N1X芯片跑分曝光!結(jié)果比較意外

    拉夫勞倫攜手微軟推出對(duì)話AI應(yīng)用購(gòu)物助手Ask Ralph

    拉夫·勞倫攜手微軟,推出由Microsoft Azure OpenAl(國(guó)際版)驅(qū)動(dòng)的對(duì)話AI應(yīng)用購(gòu)物助手“Ask Ralph”,旨在重塑數(shù)字購(gòu)物體驗(yàn)。該
    的頭像 發(fā)表于 10-13 15:45 ?192次閱讀

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片的需求和挑戰(zhàn)

    當(dāng)今社會(huì),AI已經(jīng)發(fā)展很迅速了,但是你了解AI的發(fā)展歷程嗎?本章作者將為我們打開(kāi)AI的發(fā)展歷程以及需求和挑戰(zhàn)的面紗。 從2017年開(kāi)始生成AI
    發(fā)表于 09-12 16:07

    英偉達(dá)Cosmos-Reason1 模型深度解讀

    英偉達(dá)近期發(fā)布的 Cosmos-Reason1 模型在物理常識(shí)推理領(lǐng)域引發(fā)廣泛關(guān)注。作為專為物理世界交互設(shè)計(jì)的多模態(tài)大語(yǔ)言模型,它通過(guò)融合視覺(jué)感知與復(fù)雜邏輯推理,重新定義了
    的頭像 發(fā)表于 03-29 23:29 ?2502次閱讀

    英偉達(dá)、高通布局AI投資版圖,這些明星企業(yè)被收入囊中!

    電子發(fā)燒友原創(chuàng) 章鷹 今年以來(lái),AI界新秀DeepSeek帶來(lái)的大模型平權(quán)推動(dòng)AI應(yīng)用,云計(jì)算市場(chǎng)景氣度上行,推動(dòng)資本開(kāi)支增長(zhǎng)。對(duì)于DeepSeek的橫空出世,英偉
    的頭像 發(fā)表于 03-25 09:22 ?1680次閱讀

    IBM攜手英偉達(dá)AI數(shù)據(jù)平臺(tái)推動(dòng)企業(yè)級(jí)AI創(chuàng)新

    英偉達(dá)平臺(tái)與 IBM 的 AI 和數(shù)據(jù)平臺(tái) watsonx 的集成。此外,IBM 還將與英偉達(dá)合作推出
    發(fā)表于 03-24 19:20 ?371次閱讀

    英偉達(dá)GTC2025亮點(diǎn) NVIDIA推出Cosmos世界基礎(chǔ)模型和物理AI數(shù)據(jù)工具的重大更新

    、Figure AI、Skild AI 是最早采用該技術(shù)的公司。 NVIDIA 宣布推出全新 NVIDIA Cosmos 世界基礎(chǔ)模型 (WFM) 的重大更新,該
    的頭像 發(fā)表于 03-20 19:01 ?1071次閱讀

    商湯科技推出SenseNova-5o,限時(shí)免費(fèi)實(shí)時(shí)音視頻對(duì)話服務(wù)

    商湯科技近日正式推出了其“日日新”融合大模型的交互版本——SenseNova-5o,并宣布即日起對(duì)外提供限時(shí)免費(fèi)的實(shí)時(shí)音視頻對(duì)話服務(wù)。 SenseNova-5o作為商湯科技的最新力作,
    的頭像 發(fā)表于 01-20 15:11 ?958次閱讀

    英偉達(dá)發(fā)布Nemotron-CC大型AI訓(xùn)練數(shù)據(jù)庫(kù)

    近日,英偉達(dá)在其官方博客上宣布了一項(xiàng)重大進(jìn)展,推出了一款名為Nemotron-CC的大型英文AI訓(xùn)練數(shù)據(jù)庫(kù)。這一數(shù)據(jù)庫(kù)的發(fā)布,標(biāo)志著英偉
    的頭像 發(fā)表于 01-14 14:14 ?710次閱讀

    英偉達(dá)推出基石世界模型Cosmos,解決智駕與機(jī)器人具身智能訓(xùn)練數(shù)據(jù)問(wèn)題

    CES 2025展會(huì)上,英偉達(dá)推出了基石世界模型Cosmos,World Foundation Model基石世界模型,簡(jiǎn)稱WFM。 物理
    的頭像 發(fā)表于 01-14 11:04 ?1886次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b><b class='flag-5'>推出</b>基石世界<b class='flag-5'>模型</b>Cosmos,解決智駕與機(jī)器人具身智能訓(xùn)練數(shù)據(jù)問(wèn)題

    英偉達(dá)收購(gòu)AI初創(chuàng)公司Run:ai

    全球領(lǐng)先的芯片制造商英偉達(dá)近日正式完成了對(duì)以色列人工智能初創(chuàng)公司Run:ai的收購(gòu)。這一收購(gòu)案在經(jīng)過(guò)歐盟反壟斷機(jī)構(gòu)的嚴(yán)格審查后,最終獲得了批準(zhǔn),標(biāo)志著英偉
    的頭像 發(fā)表于 12-31 10:46 ?786次閱讀

    英偉達(dá)加速認(rèn)證三星新型AI存儲(chǔ)芯片

    近日,英偉達(dá)首席執(zhí)行官黃仁勛近日在接受采訪時(shí)透露,英偉達(dá)正在全力加速對(duì)三星最新推出AI存儲(chǔ)芯片
    的頭像 發(fā)表于 11-26 10:22 ?917次閱讀

    英偉達(dá)與軟銀攜手共建日本AI基礎(chǔ)設(shè)施

    近日,英偉達(dá)創(chuàng)始人兼CEO黃仁勛宣布,英偉達(dá)將與軟銀集團(tuán)合作,在日本共同建設(shè)AI基礎(chǔ)設(shè)施,其中包括日本最大的
    的頭像 發(fā)表于 11-13 14:41 ?984次閱讀

    微軟攜手英偉達(dá)與GitHub推出生成AI加速器

    近日,微軟宣布在英國(guó)推出一項(xiàng)重大合作項(xiàng)目——生成人工智能加速器。這一項(xiàng)目由微軟、英偉達(dá)和GitHub三家科技巨頭強(qiáng)強(qiáng)聯(lián)手,旨在加速生成
    的頭像 發(fā)表于 11-05 14:58 ?1020次閱讀

    英偉達(dá)加速Rubin平臺(tái)AI芯片推出,SK海力士提前交付HBM4存儲(chǔ)器

    日,英偉達(dá)(NVIDIA)的主要高帶寬存儲(chǔ)器(HBM)供應(yīng)商南韓SK集團(tuán)會(huì)長(zhǎng)崔泰源透露,英偉達(dá)執(zhí)行長(zhǎng)黃仁勛已要求SK海力士提前六個(gè)月交付用于英偉
    的頭像 發(fā)表于 11-05 14:22 ?1735次閱讀