chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

解鎖LLM新高度—OpenVINO? 2024.1賦能生成式AI高效運(yùn)行

英特爾物聯(lián)網(wǎng) ? 來(lái)源:OpenVINO 中文社區(qū) ? 2024-05-10 10:36 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

大語(yǔ)言模型推理的改進(jìn)

LLM 的發(fā)展仍保持著驚人的速度。盡管現(xiàn)有的 LLM 已經(jīng)具備強(qiáng)大的功能,但通過(guò) OpenVINO 的優(yōu)化和推理加速,可以對(duì)這些復(fù)雜模型的執(zhí)行進(jìn)行精煉,實(shí)現(xiàn)更快、更高效的處理,減少計(jì)算開(kāi)銷并最大限度發(fā)揮硬件潛力,這將直接導(dǎo)致 LLM 實(shí)現(xiàn)更高的吞吐量和更低的延遲。

通過(guò)采用壓縮嵌入實(shí)現(xiàn)額外優(yōu)化,有效地縮減了 LLM 的編譯耗時(shí)與內(nèi)存占用。與此同時(shí),基于英特爾銳炫GPU,以及英特爾高級(jí)矩陣擴(kuò)展(Intel AMX)的第4代和第5代英特爾至強(qiáng)平臺(tái)之上,LLM 的第一個(gè) token 處理性能得到了顯著提升。

通過(guò) oneDNN 可實(shí)現(xiàn)更好的 LLM 壓縮與性能提升。如今,經(jīng)過(guò)量化或壓縮后的 INT4 和 INT8 精度的 LLM 可在英特爾銳炫GPU 上得到支持。在搭載集成 GPU 的英特爾酷睿Ultra 處理器上,針對(duì)部分小型 GenAI 模型顯著減少了內(nèi)存消耗。

此外,現(xiàn)在可以在 PyTorch 模型進(jìn)行訓(xùn)練后量化之后,對(duì)其進(jìn)行微調(diào),以提高模型精度并簡(jiǎn)化從訓(xùn)練后量化過(guò)渡到訓(xùn)練感知量化的過(guò)程。

已添加演示示例:https://github.com/openvinotoolkit/nncf/blob/develop/examples/quantization_aware_training/torch/resnet18/README.md

更多生成式 AI 覆蓋范圍和框架集成

進(jìn)一步深入了解搭載 OpenVINO 的生成式 AI,該新版本拓寬了生成式AI的邊界,使其能夠覆蓋更廣泛的神經(jīng)網(wǎng)絡(luò)架構(gòu)與應(yīng)用場(chǎng)景。

針對(duì)最新發(fā)布的最先進(jìn)的 Llama 3 和 Phi3 模型, OpenVINO 對(duì)其實(shí)現(xiàn)了支持和優(yōu)化。

具備混合專家(MoE)架構(gòu)的 LLM 模型 Mixtral 以及 URLNet 模型,均針對(duì)英特爾至強(qiáng)處理器進(jìn)行了性能提升優(yōu)化。

文生圖模型 Stable Diffusion 1.5,以及 LLMs 模型 ChatGLM3-6b和Qwen-7B,則專為搭載了集成 GPU 的英特爾酷睿Ultra 處理器進(jìn)行了推理速度的改進(jìn)和優(yōu)化。

現(xiàn)在,OpenVINO 已支持 Falcon-7B-Instruct,這是一款即用型、具備優(yōu)秀性能指標(biāo)的生成式AI大語(yǔ)言模型,適用于聊天與指令場(chǎng)景。

新版本支持的其他模型包括:

Yolo V9、Yolo V8 Oriented Bounding Box Detection (OOB)、Stable Diffusion in Keras、MoblieCLIP、RMBG-v1.4 Background Removal、Magika、TripoSR、AnimateAnyone、LLaVA-Next 以及帶有 OpenVINO 和 LangChain 的 RAG 系統(tǒng)。

我們還在 OpenVINO Notebooks 存儲(chǔ)庫(kù)中提供了 Jupyter Notebook 示例。

新平臺(tái)的更改和現(xiàn)有平臺(tái)的增強(qiáng)

除了 PyPI 上的主 OpenVINO 軟件包外,英特爾酷睿Ultra 處理器的預(yù)覽 NPU 插件現(xiàn)在在 OpenVINO 開(kāi)源 GitHub 存儲(chǔ)庫(kù)中可用。

現(xiàn)在,可以通過(guò) npm 存儲(chǔ)庫(kù)更輕松地訪問(wèn) JavaScript API,使 JavaScript 開(kāi)發(fā)人員能夠無(wú)縫訪問(wèn) OpenVINO API。我們擴(kuò)展了文檔,可幫助開(kāi)發(fā)人員將他們的 JavaScript 應(yīng)用程序與 OpenVINO 集成。

現(xiàn)在,默認(rèn)情況下已在 ARM 處理器上為卷積神經(jīng)網(wǎng)絡(luò)(CNN)啟用 FP16 推理。在多種 ARM 設(shè)備上,已顯著提升了眾多模型的性能。已實(shí)現(xiàn)與 CPU 架構(gòu)無(wú)關(guān)的構(gòu)建,旨在為不同 ARM 設(shè)備提供統(tǒng)一的二進(jìn)制分發(fā)。

新增和更新的 Notebook

OpenVINO Notebooks 仍然是非常有價(jià)值的資源,用于展示如何利用 OpenVINO 在人工智能領(lǐng)域?qū)崿F(xiàn)重要進(jìn)展。最近,我們對(duì) OpenVINO notebooks 存儲(chǔ)庫(kù)做了一些改動(dòng),包括將默認(rèn)分支從 'main' 更改為 'latest',以及對(duì) "notebooks" 文件夾內(nèi) notebook 的命名結(jié)構(gòu)進(jìn)行了改進(jìn)。



審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • GPU芯片
    +關(guān)注

    關(guān)注

    1

    文章

    307

    瀏覽量

    6554
  • 生成式AI
    +關(guān)注

    關(guān)注

    0

    文章

    538

    瀏覽量

    1133
  • OpenVINO
    +關(guān)注

    關(guān)注

    0

    文章

    118

    瀏覽量

    818

原文標(biāo)題:解鎖 LLM 新高度,拓寬模型新邊界 —— OpenVINO? 2024.1 賦能生成式 AI 高效運(yùn)行 | 開(kāi)發(fā)者實(shí)戰(zhàn)

文章出處:【微信號(hào):英特爾物聯(lián)網(wǎng),微信公眾號(hào):英特爾物聯(lián)網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    信息:軟硬協(xié)同AI,解鎖智能制造質(zhì)檢/排程新高度

    在智能制造加速升級(jí)的當(dāng)下,AI 正成為驅(qū)動(dòng)產(chǎn)業(yè)變革的核心引擎。以 AI檢測(cè)系統(tǒng)、XR智能眼鏡等智能軟硬件為抓手,企業(yè)可實(shí)現(xiàn)生產(chǎn)環(huán)節(jié)的精準(zhǔn)感知、智能判別與高效協(xié)同,大幅提升質(zhì)檢精度、作業(yè)效率與安全管
    的頭像 發(fā)表于 04-16 09:24 ?4587次閱讀

    賦予AI設(shè)備靈動(dòng)雙眸 | 匠芯創(chuàng)亮相“AI+教育硬件”沙龍 解鎖流暢交互新高度

    -高幀芯動(dòng)力解鎖流暢新高度》的主題演講。直面行業(yè)痛點(diǎn)匠芯創(chuàng)給出“芯”答案當(dāng)前,AI陪伴設(shè)備在兒童教育、智能玩具、家庭陪伴等場(chǎng)景中快速普及。然而,傳統(tǒng)AI硬件在顯示效
    的頭像 發(fā)表于 04-02 18:51 ?382次閱讀
    賦予<b class='flag-5'>AI</b>設(shè)備靈動(dòng)雙眸 | 匠芯創(chuàng)亮相“<b class='flag-5'>AI</b>+教育硬件”沙龍 <b class='flag-5'>解鎖</b>流暢交互<b class='flag-5'>新高度</b>

    思必馳攜手雅迪冠系列推動(dòng)兩輪智能出行邁向新高度

    近日,思必馳與雅迪深度攜手,為冠星艦Ⅱ、冠白鯊Ⅱ高配版兩款重磅車(chē)型量身打造7寸智能語(yǔ)音儀表,將全鏈路語(yǔ)音技術(shù)、AI大模型能力與兩輪車(chē)騎行場(chǎng)景融合,為用戶帶來(lái)更安全、更便捷、更豐富的騎行體驗(yàn),推動(dòng)兩輪智能出行邁向
    的頭像 發(fā)表于 04-02 09:13 ?849次閱讀

    還在手動(dòng)拼接 AI 代碼?你的 IDE 早就該升級(jí)了

    嵌入專用 AI 智能助手直接內(nèi)嵌到 IDE 工作流中,實(shí)現(xiàn)了代碼編輯、AI 生成、調(diào)試優(yōu)化、編譯運(yùn)行、 項(xiàng)目部署一站
    發(fā)表于 03-11 10:25

    AI定義座艙新高度|搭載天璣座艙S1 Ultra的奇瑞風(fēng)云T9L

    」推向「AI 定義座艙」的新高度。 旗艦算力 構(gòu)建車(chē)載 AI 的基礎(chǔ) ? 風(fēng)云 T9L 搭載的 MediaTek 天璣座艙 S1 Ultra 采用先進(jìn)的 3nm 制程工藝,這是其能夠平穩(wěn)運(yùn)行
    的頭像 發(fā)表于 02-12 16:19 ?2759次閱讀
    <b class='flag-5'>AI</b>定義座艙<b class='flag-5'>新高度</b>|搭載天璣座艙S1 Ultra的奇瑞風(fēng)云T9L

    新品 | LLM-8850 Kit,高性能AI加速卡套件 DinMeter v1.1,1/32DIN標(biāo)準(zhǔn)嵌入開(kāi)發(fā)板

    LLM-8850KitLLM-8850Kit是一款面向邊緣AI與嵌入計(jì)算場(chǎng)景的高性能AI加速卡套件,由LLM-8850CardAI加速卡與
    的頭像 發(fā)表于 01-30 16:11 ?1389次閱讀
    新品 | <b class='flag-5'>LLM</b>-8850 Kit,高性能<b class='flag-5'>AI</b>加速卡套件 DinMeter v1.1,1/32DIN標(biāo)準(zhǔn)嵌入<b class='flag-5'>式</b>開(kāi)發(fā)板

    探索ISO724x系列高速四通道數(shù)字隔離器,解鎖電子設(shè)計(jì)新高度

    探索ISO724x系列高速四通道數(shù)字隔離器,解鎖電子設(shè)計(jì)新高度 在電子工程師的日常設(shè)計(jì)工作中,數(shù)字隔離器是不可或缺的關(guān)鍵組件,它能夠有效阻斷高電壓、隔離接地,防止噪聲電流干擾或損壞敏感電路。今天
    的頭像 發(fā)表于 01-25 09:50 ?553次閱讀

    生成AI虛擬調(diào)試——fe.screen-sim的架構(gòu)價(jià)值

    生成AI虛擬調(diào)試——fe.screen-sim的架構(gòu)價(jià)值
    的頭像 發(fā)表于 12-04 14:59 ?1203次閱讀
    <b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b><b class='flag-5'>賦</b><b class='flag-5'>能</b>虛擬調(diào)試——fe.screen-sim的架構(gòu)價(jià)值

    搭載新潔NCE1216,解鎖高效應(yīng)用新可能

    在電子技術(shù)蓬勃發(fā)展的當(dāng)下,功率半導(dǎo)體器件已成為推動(dòng)電子系統(tǒng)高效運(yùn)行的關(guān)鍵力量。搭載新潔NCE1216,以其卓越的性能和廣泛的應(yīng)用場(chǎng)景,解鎖高效
    的頭像 發(fā)表于 10-25 16:05 ?825次閱讀
    搭載新潔<b class='flag-5'>能</b>NCE1216,<b class='flag-5'>解鎖</b><b class='flag-5'>高效</b>應(yīng)用新可能

    AI6G與衛(wèi)星通信:開(kāi)啟智能天網(wǎng)新時(shí)代

    需求?傳統(tǒng)網(wǎng)絡(luò)會(huì)因流量激增而擁堵,而AI的6G網(wǎng)絡(luò)則能提前預(yù)測(cè)流量模式,動(dòng)態(tài)調(diào)整資源分配。 AI算法能夠?qū)崟r(shí)分析海量數(shù)據(jù),包括用戶位置、網(wǎng)絡(luò)負(fù)載、歷史流量模式等。在2025年上海世
    發(fā)表于 10-11 16:01

    燃料電池負(fù)載均衡測(cè)試:解鎖高效密碼

    整理、繪圖,直觀呈現(xiàn)燃料電池在不同負(fù)載下的特性曲線。通過(guò)對(duì)比不同階段的數(shù)據(jù),精準(zhǔn)定位潛在問(wèn)題所在,為后續(xù)改進(jìn)提供依據(jù)。 通過(guò)這套嚴(yán)謹(jǐn)?shù)呢?fù)載均衡測(cè)試方案,能夠全方位評(píng)估燃料電池的性能表現(xiàn),及時(shí)發(fā)現(xiàn)并解決隱患,助力燃料電池技術(shù)邁向新高度,在清潔能源應(yīng)用中發(fā)揮更大效能。
    發(fā)表于 09-18 13:51

    AI生成的測(cè)試用例真的靠譜嗎?

    的身影無(wú)處不在。尤其在測(cè)試用例生成這一傳統(tǒng)上高度依賴人工經(jīng)驗(yàn)的環(huán)節(jié),AI展現(xiàn)出令人驚艷的能力——快速、高效、“看起來(lái)很專業(yè)”。于是,很多測(cè)試團(tuán)隊(duì)紛紛嘗試用
    的頭像 發(fā)表于 08-01 10:02 ?1909次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>生成</b>的測(cè)試用例真的靠譜嗎?

    使用 llm-agent-rag-llamaindex 筆記本時(shí)收到的 NPU 錯(cuò)誤怎么解決?

    使用 conda create -n ov-nb-demos python=3.11 創(chuàng)建運(yùn)行 llm-agent-rag-llamaindex notebook 的環(huán)境。 執(zhí)行“創(chuàng)建
    發(fā)表于 06-23 06:26

    vivo Pad5 Pro搭載MediaTek天璣9400處理器

    vivo Pad5 Pro 搭載天璣 9400 旗艦芯,實(shí)現(xiàn)效、AI 全面進(jìn)階,解鎖平板體驗(yàn)新高度。
    的頭像 發(fā)表于 06-05 14:15 ?1543次閱讀

    利用NVIDIA 3D引導(dǎo)生成AI Blueprint控制圖像生成

    AI 的圖像生成技術(shù)突飛猛進(jìn),從早期模型會(huì)生成手指過(guò)多的人類圖像,到現(xiàn)在創(chuàng)造出令人驚嘆的逼
    的頭像 發(fā)表于 06-05 09:24 ?1010次閱讀