chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

高通:未來(lái)幾個(gè)月有望在終端側(cè)運(yùn)行超100億參數(shù)的模型

Carol Li ? 來(lái)源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2023-07-26 00:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)日前,在2023世界半導(dǎo)體大會(huì)暨南京國(guó)際半導(dǎo)體博覽會(huì)上,高通全球副總裁孫剛發(fā)表演講時(shí)談到,目前高通能夠支持參數(shù)超過(guò)10億的模型在終端上運(yùn)行,未來(lái)幾個(gè)月內(nèi)超過(guò)100億參數(shù)的模型將有望在終端側(cè)運(yùn)行。

大模型在終端側(cè)運(yùn)行的重要性

生成式AI正在快速發(fā)展,數(shù)據(jù)顯示,2020年至2022年,生成式AI相關(guān)的投資增長(zhǎng)425%,初步預(yù)估生成式AI市場(chǎng)規(guī)模將達(dá)到1萬(wàn)億美元。

然而孫剛指出,云經(jīng)濟(jì)難以支持生成式AI規(guī)?;卣?,為實(shí)現(xiàn)規(guī)模化拓展,AI處理的中心正在向邊緣轉(zhuǎn)移。比如XR、汽車(chē)、手機(jī)、PC、物聯(lián)網(wǎng),生成式AI將影響各類(lèi)終端上的應(yīng)用。

高通在這方面展示出了領(lǐng)先的優(yōu)勢(shì),高通AI引擎由多個(gè)硬件和軟件組件組成,用于在驍龍移動(dòng)平臺(tái)上為終端側(cè)AI推理加速。它采用異構(gòu)計(jì)算架構(gòu),包括高通Hexagon處理器Adreno GPU、Kryo CPU傳感器中樞,共同支持在終端上運(yùn)行AI應(yīng)用程序。

在7月初的2023年世界人工智能大會(huì)上,高通就已經(jīng)展示了全球首個(gè)在終端側(cè)運(yùn)行生成式AI(AIGC)模型Stable Diffusion的技術(shù)演示,和全球最快的終端側(cè)語(yǔ)言-視覺(jué)模型(LVM)ControlNet運(yùn)行演示。這兩款模型的參數(shù)量已經(jīng)達(dá)到10億-15億,僅在十幾秒內(nèi)就能夠完成一系列推理,根據(jù)輸入的文字或圖片生成全新的AI圖像。

今年7月18日,Meta官宣將發(fā)布其開(kāi)源大模型LLaMA的商用版本,為初創(chuàng)企業(yè)和其他企業(yè)提供了一個(gè)強(qiáng)大的免費(fèi)選擇,以取代OpenAI和谷歌出售的昂貴的專(zhuān)有模型。隨后,高通發(fā)布公告稱(chēng),從2024年起,Llama 2將能在旗艦智能手機(jī)和PC上運(yùn)行。

高通技術(shù)公司高級(jí)副總裁兼邊緣云計(jì)算解決方案業(yè)務(wù)總經(jīng)理Durga Malladi表示,為了有效地將生成式人工智能推廣到主流市場(chǎng),人工智能將需要同時(shí)在云端和邊緣終端(如智能手機(jī)、筆記本電腦、汽車(chē)和物聯(lián)網(wǎng)終端)上運(yùn)行。

在高通看來(lái),和基于云端的大語(yǔ)言模型相比,在智能手機(jī)等設(shè)備上運(yùn)行Llama 2 等大型語(yǔ)言模型的邊緣云計(jì)算具有許多優(yōu)勢(shì),不僅成本更低、性能更好,還可以在斷網(wǎng)的情況下工作,而且可以提供更個(gè)性化、更安全的AI服務(wù)。

如何讓大模型在終端規(guī)模化擴(kuò)展

生成式AI進(jìn)入未來(lái)生活的趨勢(shì)已經(jīng)不可阻擋,為了讓生成式AI規(guī)模化擴(kuò)展到更多終端設(shè)備中,高通提出了混合AI架構(gòu)的運(yùn)行方式,即在云端和設(shè)備終端的邊緣側(cè)之間分配算力,協(xié)同處理AI工作負(fù)載。

所謂混合AI,是指充分利用邊緣側(cè)終端算力支持生成式AI應(yīng)用的方式,相比僅在云端運(yùn)行的AI,前者能夠帶來(lái)高性能、個(gè)性化且更安全的體驗(yàn)。

比如,如果模型、提示或生成內(nèi)容的長(zhǎng)度小于某個(gè)限定值,且精度足夠,推理就可以完全在終端側(cè)進(jìn)行;如果任務(wù)相對(duì)復(fù)雜,則可以部分依靠云端模型;如果需要更多實(shí)時(shí)內(nèi)容,模型也可以接入互聯(lián)網(wǎng)獲取信息。

在未來(lái),不同的生成式AI用不同分流方式的混合AI架構(gòu),AI也能在此基礎(chǔ)上持續(xù)演進(jìn):
?大量生成式AI的應(yīng)用,比如圖像生成或文本創(chuàng)作,需求AI能夠進(jìn)行實(shí)時(shí)響應(yīng)。在這種任務(wù)上,終端可通過(guò)運(yùn)行不太復(fù)雜的推理完成大部分任務(wù)。

在A(yíng)I計(jì)算的實(shí)現(xiàn)上,軟件和硬件同樣重要,因?yàn)楸仨氃诙藗?cè)做到運(yùn)算更快,效率更高,并推動(dòng)AI應(yīng)用在廣泛終端上的部署和普及。

高通在2022年6月推出AI軟件棧(Qualcomm AI Stack),其支持包括TensorFlow、Pytorch和ONNX在內(nèi)的所有主流開(kāi)發(fā)框架,所有runtimes(運(yùn)行時(shí),即某門(mén)編程語(yǔ)言的運(yùn)行環(huán)境)和操作系統(tǒng)。借助高通AI軟件棧,開(kāi)發(fā)者在智能手機(jī)領(lǐng)域開(kāi)發(fā)的軟件可以快速擴(kuò)展至汽車(chē)、XR、可穿戴設(shè)備等其他產(chǎn)品線(xiàn)進(jìn)行使用。

高通技術(shù)公司產(chǎn)品管理高級(jí)副總裁兼AI負(fù)責(zé)人Ziad Asghar表示,未來(lái)公司需要加大終端側(cè)技術(shù)上的研發(fā),尤其是進(jìn)一步提升量化的算法。例如服務(wù)器上訓(xùn)練的模型一般采用32位浮點(diǎn)運(yùn)算(FP32),而我們?cè)谑謾C(jī)端現(xiàn)在能夠支持INT4計(jì)算,這能大大提高端側(cè)的處理能力。

小結(jié)

不僅僅是大模型的訓(xùn)練需要極大的算力和功耗,部署也同樣如此。如果要讓大模型在更多的領(lǐng)域?qū)崿F(xiàn)落地應(yīng)用,除了在云端部署之后,在終端側(cè)部署也很關(guān)鍵。目前已經(jīng)有諸多廠(chǎng)商在該領(lǐng)域進(jìn)行探索,包括高通,期待未來(lái)大模型能夠走進(jìn)人們生活的方方面面。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 高通
    +關(guān)注

    關(guān)注

    78

    文章

    7684

    瀏覽量

    198706
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    廣和通發(fā)布端側(cè)情感對(duì)話(huà)大模型FiboEmo-LLM

    9月,廣和通正式發(fā)布自主研發(fā)的端側(cè)情感對(duì)話(huà)大模型FiboEmo-LLM。該模型專(zhuān)注于情感計(jì)算與自然語(yǔ)言交互融合,致力于為AI玩具、智能陪伴設(shè)備等終端場(chǎng)景提供“情感理解-情感響應(yīng)”一體化
    的頭像 發(fā)表于 09-26 13:37 ?1610次閱讀

    TPS1HC100-Q1智能側(cè)開(kāi)關(guān)技術(shù)解析與應(yīng)用指南

    Texas Instruments TPS1HC100-Q1智能高壓側(cè)開(kāi)關(guān)是一款具有全方位保護(hù)的側(cè)電源開(kāi)關(guān),它集成有NMOS功率FET和電荷泵,專(zhuān)用于對(duì)各種負(fù)載進(jìn)行智能控制。憑借著精
    的頭像 發(fā)表于 09-25 10:19 ?431次閱讀
    TPS1HC<b class='flag-5'>100</b>-Q1智能<b class='flag-5'>高</b><b class='flag-5'>側(cè)</b>開(kāi)關(guān)技術(shù)解析與應(yīng)用指南

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI的未來(lái):提升算力還是智力

    本章節(jié)作者分析了下AI的未來(lái)在哪里,就目前而言有來(lái)那個(gè)兩種思想:①繼續(xù)增加大模型②將大模型改為小模型,并將之優(yōu)化使之與大模型性能不不相上下。
    發(fā)表于 09-14 14:04

    谷歌推出AI模型Gemma 3 270M

    過(guò)去幾個(gè)月,Gemma 開(kāi)放模型系列的發(fā)展是激動(dòng)人心的。我們推出了 Gemma 3 和 Gemma 3 QAT,為單一云端和桌面加速器帶來(lái)了最先進(jìn)的性能。
    的頭像 發(fā)表于 09-11 15:09 ?898次閱讀

    米爾RK3576部署端側(cè)多模態(tài)多輪對(duì)話(huà),6TOPS算力驅(qū)動(dòng)30參數(shù)LLM

    2 參數(shù)模型的增量訓(xùn)練; 接入語(yǔ)音能力:main.cpp中集成 VAD(語(yǔ)音活動(dòng)檢測(cè))+ ASR(語(yǔ)音識(shí)別,如 Whisper-Tiny INT8)模塊,將語(yǔ)音轉(zhuǎn)換為文本后接入現(xiàn)有推理流水線(xiàn),實(shí)現(xiàn)
    發(fā)表于 09-05 17:25

    ALINX VD100低功耗端側(cè)模型部署方案,運(yùn)行3B模型功耗僅5W?!

    模型運(yùn)行≠用戶(hù)體驗(yàn)好。 IDC 預(yù)測(cè),到 2026 年,全球超過(guò) 50% 的企業(yè) AI 工作負(fù)載將部署邊緣設(shè)備上。 AI 部署逐漸從云端轉(zhuǎn)向邊緣端的趨勢(shì)下,越來(lái)越多智能
    的頭像 發(fā)表于 09-03 14:58 ?487次閱讀
    ALINX VD<b class='flag-5'>100</b>低功耗端<b class='flag-5'>側(cè)</b>大<b class='flag-5'>模型</b>部署方案,<b class='flag-5'>運(yùn)行</b>3B<b class='flag-5'>模型</b>功耗僅5W?!

    AI的未來(lái),屬于那些既能寫(xiě)代碼,又能焊電路的“雙棲人才”

    的信號(hào):AI真正的未來(lái),不只屬于“算法天才”,更屬于那些既能寫(xiě)代碼,又能焊電路的“雙棲工程師”。無(wú)論是AI芯片、智能終端、機(jī)器人、邊緣計(jì)算還是大模型下沉的討論中,我們不斷聽(tīng)到同一個(gè)問(wèn)
    發(fā)表于 07-30 16:15

    終于有人把端側(cè)模型說(shuō)清楚了

    "端側(cè)"大模型?聊具體內(nèi)容之前,先解釋一下這個(gè)名字的由來(lái)。計(jì)算機(jī)和通信領(lǐng)域,我們通常把整個(gè)系統(tǒng)分為幾個(gè)層次:云端(Cloud):遠(yuǎn)程的數(shù)
    的頭像 發(fā)表于 07-24 12:03 ?1697次閱讀
    終于有人把端<b class='flag-5'>側(cè)</b>大<b class='flag-5'>模型</b>說(shuō)清楚了

    首創(chuàng)開(kāi)源架構(gòu),天璣AI開(kāi)發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    。 Neuron Studio 還支持自動(dòng)化調(diào)優(yōu)神經(jīng)網(wǎng)絡(luò)使用的帶寬及性能,開(kāi)發(fā)過(guò)程中,將性能和內(nèi)存占用自動(dòng)優(yōu)化至最佳配置。而且,開(kāi)發(fā)者可以全程監(jiān)控大模型演化過(guò)程。以前萬(wàn)組參數(shù)手動(dòng)調(diào)優(yōu)動(dòng)輒需要一周,而現(xiàn)在
    發(fā)表于 04-13 19:52

    通推動(dòng)終端側(cè)AI釋放全新價(jià)值

    通過(guò)蒸餾技術(shù)將百億參數(shù)模型壓縮至端側(cè)設(shè)備可運(yùn)行的創(chuàng)新,讓AI推理成本大幅下降,為終端側(cè)AI的爆發(fā)按下加速鍵。低成本、
    的頭像 發(fā)表于 03-21 09:28 ?1003次閱讀
    <b class='flag-5'>高</b>通推動(dòng)<b class='flag-5'>終端</b><b class='flag-5'>側(cè)</b>AI釋放全新價(jià)值

    移遠(yuǎn)通信邊緣計(jì)算模組成功運(yùn)行DeepSeek模型,以領(lǐng)先的工程能力加速端側(cè)AI落地

    。 ? 目前,該模型正在多款智能終端上進(jìn)行深入測(cè)試與優(yōu)化。移遠(yuǎn)通信將憑借其卓越的工程化能力,加速端側(cè)AI技術(shù)各行各業(yè)的規(guī)?;瘧?yīng)用與普及。 ? ? DeepSeek : AI
    發(fā)表于 02-13 11:32 ?447次閱讀
    移遠(yuǎn)通信邊緣計(jì)算模組成功<b class='flag-5'>運(yùn)行</b>DeepSeek<b class='flag-5'>模型</b>,以領(lǐng)先的工程能力加速端<b class='flag-5'>側(cè)</b>AI落地

    移遠(yuǎn)通信邊緣計(jì)算模組成功運(yùn)行DeepSeek模型,以領(lǐng)先的工程能力加速端側(cè)AI落地

    。目前,該模型正在多款智能終端上進(jìn)行深入測(cè)試與優(yōu)化。移遠(yuǎn)通信將憑借其卓越的工程化能力,加速端側(cè)AI技術(shù)各行各業(yè)的規(guī)?;瘧?yīng)用與普及。DeepSeek:AI
    的頭像 發(fā)表于 02-12 19:03 ?767次閱讀
    移遠(yuǎn)通信邊緣計(jì)算模組成功<b class='flag-5'>運(yùn)行</b>DeepSeek<b class='flag-5'>模型</b>,以領(lǐng)先的工程能力加速端<b class='flag-5'>側(cè)</b>AI落地

    Kaggle知識(shí)點(diǎn):7種參數(shù)搜索方法

    問(wèn)題。一些常見(jiàn)的參數(shù)例子包括梯度基算法中的學(xué)習(xí)率,或者決策樹(shù)算法中樹(shù)的深度,這些可以直接影響模型準(zhǔn)確擬合訓(xùn)練數(shù)據(jù)的能力。參數(shù)調(diào)優(yōu)涉及
    的頭像 發(fā)表于 02-08 14:28 ?1710次閱讀
    Kaggle知識(shí)點(diǎn):7種<b class='flag-5'>超</b><b class='flag-5'>參數(shù)</b>搜索方法

    xgboost參數(shù)調(diào)優(yōu)技巧 xgboost圖像分類(lèi)中的應(yīng)用

    一、XGBoost參數(shù)調(diào)優(yōu)技巧 XGBoost(eXtreme Gradient Boosting)是一種基于梯度提升決策樹(shù)(GBDT)的高效梯度提升框架,機(jī)器學(xué)習(xí)競(jìng)賽和實(shí)際業(yè)務(wù)應(yīng)用中取得了卓越
    的頭像 發(fā)表于 01-31 15:16 ?2168次閱讀

    鑄科技榮登2024創(chuàng)業(yè)邦100未來(lái)獨(dú)角獸榜單

    第16屆創(chuàng)業(yè)邦100未來(lái)獨(dú)角獸峰會(huì)上,鑄科技以其AI大算力芯片領(lǐng)域的杰出成就和巨大潛力,榮登“2024創(chuàng)業(yè)邦
    的頭像 發(fā)表于 12-28 15:49 ?1197次閱讀