chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Arm與ExecuTorch合作加速端側(cè)生成式AI實(shí)現(xiàn)

Arm社區(qū) ? 來源:Arm社區(qū) ? 2024-11-15 11:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:Arm 戰(zhàn)略與生態(tài)部人工智能開發(fā)者平臺(tái)與服務(wù)高級(jí)副總裁 Alex Spinelli

通過 Arm 計(jì)算平臺(tái)與 ExecuTorch 框架的結(jié)合,使得更小、更優(yōu)化的模型能夠在邊緣側(cè)運(yùn)行,加速邊緣側(cè)生成式 AI 的實(shí)現(xiàn)。

新的 Llama 量化模型適用于基于 Arm 平臺(tái)的端側(cè)和邊緣側(cè) AI 應(yīng)用,可減少內(nèi)存占用,提高精度、性能和可移植性。

全球 2,000 萬名 Arm 開發(fā)者能夠更迅速地在數(shù)十億臺(tái)邊緣側(cè)設(shè)備上大規(guī)模開發(fā)和部署更多的智能 AI 應(yīng)用。

Arm 正在與 Meta 公司的 PyTorch 團(tuán)隊(duì)攜手合作,共同推進(jìn)新的 ExecuTorch 測試版 (Beta) 上線,旨在為全球數(shù)十億邊緣側(cè)設(shè)備和數(shù)百萬開發(fā)者提供人工智能 (AI) 和機(jī)器學(xué)習(xí) (ML) 功能,進(jìn)而確保 AI 真正的潛力能被最廣泛的設(shè)備和開發(fā)者所使用。

借助 ExecuTorch 和新的 Llama 量化模型,Arm 計(jì)算平臺(tái)優(yōu)化生成式 AI 性能

Arm 計(jì)算平臺(tái)無處不在,為全球眾多邊緣側(cè)設(shè)備提供支持,而 ExecuTorch 則是專為移動(dòng)和邊緣側(cè)設(shè)備部署 AI 模型而設(shè)計(jì)的 PyTorch 原生部署框架。兩者的緊密合作,使開發(fā)者能夠賦能更小、更優(yōu)化的模型,包括新的 Llama 3.2 1B 和 3B 量化模型。這些新模型可以減少內(nèi)存占用、提高準(zhǔn)確性、增強(qiáng)性能和提供可移植性,成為小型設(shè)備上的生成式 AI 應(yīng)用的理想選擇,如虛擬聊天機(jī)器人、文本摘要和 AI 助手。

開發(fā)者無需額外的修改或優(yōu)化,便可將新的量化模型無縫集成到應(yīng)用中,從而節(jié)省時(shí)間和資源。如此一來,他們能夠迅速在廣泛的 Arm 設(shè)備上大規(guī)模開發(fā)和部署更多的智能 AI 應(yīng)用。

隨著 Llama 3.2 大語言模型 (LLM) 新版本的發(fā)布,Arm 正在通過 ExecuTorch 框架優(yōu)化 AI 性能,使得在 Arm 計(jì)算平臺(tái)邊緣設(shè)備運(yùn)行的真實(shí)生成式 AI 工作負(fù)載能更為快速。在 ExecuTorch 測試版發(fā)布的首日起,開發(fā)者便能享有這些性能的提升。

集成 KleidiAI,加速端側(cè)生成式 AI 的實(shí)現(xiàn)

在移動(dòng)領(lǐng)域,Arm 與 ExecuTorch 的合作意味著眾多生成式 AI 應(yīng)用,如虛擬聊天機(jī)器人、文本生成和摘要、實(shí)時(shí)語音和虛擬助手等,完全能夠在搭載 Arm CPU 的設(shè)備上以更高的性能運(yùn)行。這一成果得益于 KleidiAI,它引入了針對 4 位量化優(yōu)化的微內(nèi)核,并通過 XNNPACK 集成到了 ExecuTorch 中,因此,在 Arm 計(jì)算平臺(tái)上運(yùn)行 4 位量化的 LLM 時(shí),無縫加速 AI 工作負(fù)載的執(zhí)行。例如,通過 KleidiAI 的集成,Llama 3.2 1B 量化模型預(yù)填充階段的執(zhí)行速度可以提高 20%,使得一些基于 Arm 架構(gòu)的移動(dòng)設(shè)備上的文本生成速度超過了每秒 400 個(gè)詞元 (token)。這意味著,終端用戶將從他們移動(dòng)設(shè)備上獲得更快速、響應(yīng)更靈敏的 AI 體驗(yàn)。

物聯(lián)網(wǎng)的邊緣側(cè) AI 應(yīng)用加速實(shí)時(shí)處理能力

在物聯(lián)網(wǎng)領(lǐng)域,ExecuTorch 將提高邊緣側(cè) AI 應(yīng)用的實(shí)時(shí)處理能力,包括智能家電、可穿戴設(shè)備以及自動(dòng)零售系統(tǒng)等。這意味著物聯(lián)網(wǎng)設(shè)備和應(yīng)用能夠以毫秒級(jí)的速度響應(yīng)環(huán)境變化,這對保障安全性和功能可用性至關(guān)重要。

ExecuTorch 可在 Arm Cortex-A CPU 和 Ethos-U NPU 上運(yùn)行,以加速邊緣側(cè) AI 應(yīng)用的開發(fā)和部署。事實(shí)上,通過將 ExecuTorch 與 Arm Corstone-320 參考平臺(tái)(也可作為仿真固定虛擬平臺(tái) (FVP) 使用)、Arm Ethos-U85 NPU 驅(qū)動(dòng)程序和編譯器支持集成到一個(gè)軟件包中,開發(fā)者可在平臺(tái)上市前幾個(gè)月就著手開發(fā)邊緣側(cè) AI 應(yīng)用。

更易獲取、更快捷的邊緣側(cè) AI 開發(fā)體驗(yàn)

ExecuTorch 有潛力成為全球最受歡迎的高效 AI 和 ML 開發(fā)框架之一。通過將應(yīng)用最廣泛的 Arm 計(jì)算平臺(tái)與 ExecuTorch 相結(jié)合,Arm 正在通過新的量化模型加速 AI 的普及,讓開發(fā)者能夠更快地在更多設(shè)備上部署應(yīng)用,并將更多生成式 AI 體驗(yàn)引入邊緣側(cè)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • ARM
    ARM
    +關(guān)注

    關(guān)注

    135

    文章

    9552

    瀏覽量

    391806
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39707

    瀏覽量

    301314
  • 人工智能
    +關(guān)注

    關(guān)注

    1817

    文章

    50091

    瀏覽量

    265222

原文標(biāo)題:ExecuTorch 測試版上線,加速 Arm 平臺(tái)邊緣側(cè)生成式 AI 發(fā)展

文章出處:【微信號(hào):Arm社區(qū),微信公眾號(hào):Arm社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    利用ExecuTorchArm SME2加速側(cè)機(jī)器學(xué)習(xí)推理

    貼紙、分離主體以替換背景,或是對圖像局部進(jìn)行選擇性增強(qiáng)。這些效果背后,是輕量級(jí)分割模型在運(yùn)行,這些模型通過 ExecuTorch(PyTorch 的開源側(cè)推理運(yùn)行時(shí))以及第二代 Arm
    的頭像 發(fā)表于 03-03 10:27 ?285次閱讀
    利用<b class='flag-5'>ExecuTorch</b>和<b class='flag-5'>Arm</b> SME2<b class='flag-5'>加速</b><b class='flag-5'>端</b><b class='flag-5'>側(cè)</b>機(jī)器學(xué)習(xí)推理

    應(yīng)對側(cè)AI算力、內(nèi)存、功耗“三堵墻”困境,安謀科技Arm China “周易”X3給出技術(shù)錦囊

    AI大模型正加速從云端向邊緣與側(cè)滲透,然而,算力、內(nèi)存、功耗等卻成了制約其規(guī)?;涞氐摹案邏Α?。專為AI計(jì)算而生的神經(jīng)網(wǎng)絡(luò)處理器(NPU)
    的頭像 發(fā)表于 12-18 13:45 ?401次閱讀
    應(yīng)對<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>算力、內(nèi)存、功耗“三堵墻”困境,安謀科技<b class='flag-5'>Arm</b> China “周易”X3給出技術(shù)錦囊

    重磅合作!Quintauris 聯(lián)手 SiFive,加速 RISC-V 在嵌入AI 領(lǐng)域落地

    據(jù)科技區(qū)角報(bào)道半導(dǎo)體解決方案提供商 Quintauris 最近宣布和 RISC-V 處理器 IP 領(lǐng)域的頭部廠商 SiFive 達(dá)成戰(zhàn)略合作,目標(biāo)直接瞄準(zhǔn)加速 RISC-V 在嵌入、AI
    發(fā)表于 12-18 12:01

    Alif Semiconductor的Ensemble MCU新增對ExecuTorch Runtime的支持,助力其推動(dòng)邊緣生成AI發(fā)展

    ·?Ensemble E4/E6/E8是業(yè)界首個(gè)為Transformer網(wǎng)絡(luò)提供硬件加速的MCU系列,可在邊緣設(shè)備及終端設(shè)備上實(shí)現(xiàn)本地生成AI
    的頭像 發(fā)表于 11-04 11:44 ?1478次閱讀
    Alif Semiconductor的Ensemble MCU新增對<b class='flag-5'>ExecuTorch</b> Runtime的支持,助力其推動(dòng)邊緣<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>發(fā)展

    AI體驗(yàn)躍遷,天璣9500用雙NPU開創(chuàng)側(cè)AI新時(shí)代

    架構(gòu),從底層解決性能與功耗的矛盾:超性能 NPU 990 性能大幅提升,生成 AI 引擎 2.0 深度加速 Transformer 與大模型;行業(yè)首個(gè)超能效 NPU以存算一體
    的頭像 發(fā)表于 09-24 14:47 ?749次閱讀
    <b class='flag-5'>AI</b>體驗(yàn)躍遷,天璣9500用雙NPU開創(chuàng)<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>新時(shí)代

    此芯科技發(fā)布“合一”AI加速計(jì)劃,賦能邊緣與側(cè)AI創(chuàng)新

    此芯科技正式發(fā)布“合一”AI加速計(jì)劃,旨在為邊緣計(jì)算和側(cè)AI場景提供高能效的全棧算力解決方案。該計(jì)劃由此芯科技聯(lián)合多家行業(yè)
    的頭像 發(fā)表于 09-15 11:53 ?2011次閱讀
    此芯科技發(fā)布“合一”<b class='flag-5'>AI</b><b class='flag-5'>加速</b>計(jì)劃,賦能邊緣與<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>創(chuàng)新

    Arm神經(jīng)技術(shù)是業(yè)界首創(chuàng)在 Arm GPU 上增添專用神經(jīng)加速器的技術(shù),移動(dòng)設(shè)備上實(shí)現(xiàn)PC級(jí)別的AI圖形性能

    Arm 神經(jīng)技術(shù)是業(yè)界首創(chuàng)在 Arm GPU 上增添專用神經(jīng)加速器的技術(shù),首次在移動(dòng)設(shè)備上實(shí)現(xiàn) PC 級(jí)別的 AI 圖形性能,為未來的
    的頭像 發(fā)表于 08-14 17:59 ?2756次閱讀

    Arm率先適配騰訊混元開源模型,助力側(cè)AI創(chuàng)新開發(fā)

    伙伴共同賦能側(cè)人工智能 (AI) 部署,助力本土開發(fā)者實(shí)現(xiàn) AI 應(yīng)用創(chuàng)新! 這次的首日開源適配是雙方再次攜手提升
    的頭像 發(fā)表于 08-08 09:16 ?1383次閱讀
    <b class='flag-5'>Arm</b>率先適配騰訊混元開源模型,助力<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>創(chuàng)新開發(fā)

    誠邁科技、智達(dá)誠遠(yuǎn)隆重推出ArraymoAIOS 2.0 側(cè)AI操作系統(tǒng),開啟智能體協(xié)作新時(shí)代

    隨著生成AI技術(shù)的日益成熟,目前大模型正在從云側(cè)向云協(xié)同遷移。2025年,AI進(jìn)一步加速向終
    的頭像 發(fā)表于 04-22 17:31 ?1309次閱讀
    誠邁科技、智達(dá)誠遠(yuǎn)隆重推出ArraymoAIOS 2.0 <b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>操作系統(tǒng),開啟智能體協(xié)作新時(shí)代

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓側(cè)AI模型接入得心應(yīng)手

    的自有模型移植,使首字詞生態(tài)速度比云端方案提升70%,賦能絕影多模態(tài)智能座艙強(qiáng)大的側(cè)運(yùn)行能力,讓汽車擁有“有趣的靈魂”。 不僅如此,天璣AI開發(fā)套件已經(jīng)接入NVIDIA TAO生態(tài)圈,實(shí)現(xiàn)
    發(fā)表于 04-13 19:52

    AI大模型側(cè)部署正當(dāng)時(shí):移遠(yuǎn)端側(cè)AI大模型解決方案,激活場景智能新范式

    AI技術(shù)飛速發(fā)展的當(dāng)下,AI大模型的應(yīng)用正從云端向側(cè)加速滲透。 作為全球領(lǐng)先的物聯(lián)網(wǎng)整體解決方案供應(yīng)商,移遠(yuǎn)通信憑借深厚的技術(shù)積累與前瞻
    發(fā)表于 03-27 11:26 ?562次閱讀
    <b class='flag-5'>AI</b>大模型<b class='flag-5'>端</b>側(cè)部署正當(dāng)時(shí):移遠(yuǎn)端<b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>大模型解決方案,激活場景智能新范式

    AI大模型側(cè)部署正當(dāng)時(shí):移遠(yuǎn)端側(cè)AI大模型解決方案,激活場景智能新范式

    AI技術(shù)飛速發(fā)展的當(dāng)下,AI大模型的應(yīng)用正從云端向側(cè)加速滲透。作為全球領(lǐng)先的物聯(lián)網(wǎng)整體解決方案供應(yīng)商,移遠(yuǎn)通信憑借深厚的技術(shù)積累與前瞻性
    的頭像 發(fā)表于 03-26 19:05 ?1246次閱讀
    <b class='flag-5'>AI</b>大模型<b class='flag-5'>端</b>側(cè)部署正當(dāng)時(shí):移遠(yuǎn)端<b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>大模型解決方案,激活場景智能新范式

    Arm與Stability AI攜手合作加快文本轉(zhuǎn)音頻的響應(yīng)速度

    ”,幾秒鐘后,你的設(shè)備就會(huì)為你生成合適的聲音,甚至無需聯(lián)網(wǎng)就可實(shí)現(xiàn)。得益于 Arm 和 Stability AI 的新合作,這種完全在
    的頭像 發(fā)表于 03-25 15:54 ?790次閱讀

    Arm與阿里巴巴合作加速側(cè)多模態(tài)AI體驗(yàn)

    Arm 控股有限公司(納斯達(dá)克股票代碼:ARM,以下簡稱“Arm”)近日發(fā)布與阿里巴巴淘天集團(tuán)輕量級(jí)深度學(xué)習(xí)框架 MNN 的又一新合作
    的頭像 發(fā)表于 03-10 09:07 ?1213次閱讀

    芯訊通首次發(fā)布全新側(cè)AI全棧解決方案SIMCom AI Stack

    Stack。攜手全球合作伙伴共同加速側(cè)智能創(chuàng)新與應(yīng)用。 構(gòu)建側(cè)
    的頭像 發(fā)表于 03-08 09:56 ?1252次閱讀