chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英特爾OpenVINO 2025.0正式發(fā)布

英特爾物聯(lián)網(wǎng) ? 來源:OpenVINO 中文社區(qū) ? 2025-02-21 10:20 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

來源:OpenVINO 中文社區(qū)

作者:

武卓英特爾 OpenVINO 布道師

生成式AI(GenAI)在模型質(zhì)量與應(yīng)用范圍上持續(xù)爆發(fā)式增長,DeepSeek 等頂尖模型已引發(fā)行業(yè)熱議,這種勢頭預(yù)計將在 2025年延續(xù)。本次更新聚焦性能提升、更多生成式AI 模型的支持,并針對英特爾神經(jīng)處理單元(NPU)推出關(guān)鍵優(yōu)化。讓我們來一探究竟吧!

新增圖像生成場景與模型支持

OpenVINO 2025.0 版本正式支持FLUX.1 圖像生成模型(含Dev與Schnell變體),可在英特爾 CPU/GPU 上通過 GenAI 流水線運行。開發(fā)者現(xiàn)可通過 Optimum-Intel 導(dǎo)出 Flux 模型,并結(jié)合 Text2ImagePipeline 生成圖像。針對 Flux 模型對精度變化非常敏感的特點,我們進行了深度優(yōu)化,確保圖像生成性能與準確度兼得。

LoRA適配器:模型定制利器

自前期版本起,OpenVINO 已支持基于 Safetensor 文件的LoRA 低秩適配技術(shù),無需重新編譯即可動態(tài)切換 LoRA 適配器,從而快速方便的生成不同定制化風格的圖像。本次更新進一步擴展至 Flux 模型家族,開發(fā)者可直接從 Hugging Face Hub 下載適配器,通過 GenAI 的 Text2ImagePipeline 快速實現(xiàn)風格定制。

示例:

LoRA 增強的 FLUX.1-Dev 圖像生成效果


展示了 INT8 量化版 FLUX.1-dev 模型在應(yīng)用 Yarn 風格 LoRA 前后的對比(提示詞:"albert einstein, yarn art style",初始種子=420,迭代次數(shù)=20):

新場景支持:Image2Image 與 Inpainting

新增Image2ImageInpainting流水線(預(yù)覽版),解鎖更可控的創(chuàng)作方式:

Image2Image:以圖像+文本為輸入生成新圖像,提升結(jié)果可控性;

Inpainting:通過掩碼圖像替換輸入圖像的指定區(qū)域,支持局部內(nèi)容再生。

兩種流水線均兼容 LoRA 適配器,滿足定制化需求。

文本生成場景優(yōu)化

本次新版本在 LLMPipeline API 中引入了對提示詞查找解碼的預(yù)覽支持,這是對推測解碼的簡化,它在輸入提示詞本身中用直接查找機制取代了傳統(tǒng)的草稿模型。這有助于在具有高相似性的請求的情況下顯著減少生成延遲。例如,通過對一組文檔的問答可以觀察到性能優(yōu)勢,因為答案將根據(jù)作為提示詞本身一部分的文檔來生成。

如我們的示例所示,只需對 LLMPipeline 中的代碼進行很小的修改,即可啟用此功能??偨Y(jié)來說,您需要將提示查找作為流水線中的一個參數(shù)啟用,并修改生成配置以添加兩個重要參數(shù):在提示詞中查找多少 token 數(shù)以及匹配后取多少 token 數(shù)。

生成過程中的內(nèi)存使用是運行應(yīng)用的一個重要考慮因素,因為 LLM 權(quán)重非常占用內(nèi)存。KV Cache 代表了額外的內(nèi)存消耗,并且可能會增長得相當大。我們引入了 KV Cache 的壓縮作為一種減少內(nèi)存消耗的技術(shù),在這個版本中,我們默認在 CPU 上啟用它。為了確保壓縮的準確性,我們引入了非對稱 INT8 壓縮,被證明是總體來說最準確的壓縮方式。如果需要,INT4 壓縮也可作為進一步減少內(nèi)存消耗的選項。在未來的版本中,我們計劃啟用更多的壓縮技術(shù),請持續(xù)關(guān)注。

另外,我們一直在努力支持和驗證最新的模型,包括 Mistral-7B-Instruct-v0.2、Qwen2.5,當然我們也支持基于 LLama 和 Qwen 架構(gòu)的 DeepSeek 蒸餾模型。您可以探索我們的新的使用 DeepSeek-R1 蒸餾模型進行 LLM 推理的 Notebook 代碼示例,并查看下面與英特爾 酷睿 Ultra 200V GPU 上的 DeepSeek-R1-Llama-8b 模型的對話:

https://github.com/openvinotoolkit/openvino_notebooks/tree/latest/notebooks/deepseek-r1

通過 torch.compile

支持英特爾 NPU

2025.0 版本首次實現(xiàn) NPU 加速支持,開發(fā)者可通過 PyTorch 的 torch.compile 接口調(diào)用英特爾 NPU 算力。OpenVINO 作為 torch.compile 生態(tài)系統(tǒng)中的編譯器已經(jīng)面世一段時間了。它已經(jīng)在 CPU 和 GPU 上得到支持,并且在性能方面非常接近原生 OpenVINO 推理。在 2025.0 版本中,我們將推出對 Intel NPU 作為推理設(shè)備的預(yù)覽支持。這包括對 TorchVision、Timm 和 TorchBench 存儲庫中的300多個模型的支持。

啟用方式非常簡單,只需要增加如下兩行代碼:

b6c39f82-ef73-11ef-9310-92fbcf53809c.png

結(jié)果因模型而異,因此建議您嘗試使用自己的模型以查看性能的提升情況。同時我們建議在英特爾 酷睿 Ultra Series 2 及更高版本的平臺上使用此功能。

總結(jié)

隨著我們迎來激動人心的新一年,生成式AI的潛力繼續(xù)重塑我們的創(chuàng)造、工作和創(chuàng)新方式。

借助 OpenVINO 2025.0,我們提供了更多的模型覆蓋、更快的推理性能和擴展的英特爾 NPU 支持。這只是一個開始——今年我們?nèi)暧媱澃l(fā)布更多版本,請繼續(xù)關(guān)注即將到來的更新!

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英特爾
    +關(guān)注

    關(guān)注

    61

    文章

    10301

    瀏覽量

    180459
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5194

    瀏覽量

    135461
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3752

    瀏覽量

    52111
  • OpenVINO
    +關(guān)注

    關(guān)注

    0

    文章

    118

    瀏覽量

    768

原文標題:開發(fā)者實戰(zhàn)|OpenVINO? 2025.0正式發(fā)布!DeepSeek支持、FLUX.1圖像生成、英特爾? NPU加速全面升級

文章出處:【微信號:英特爾物聯(lián)網(wǎng),微信公眾號:英特爾物聯(lián)網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    英特爾舉辦行業(yè)解決方案大會,共同打造機器人“芯”動脈

    11月19日,在2025英特爾行業(yè)解決方案大會上,英特爾展示了基于英特爾? 酷睿? Ultra平臺的最新邊緣AI產(chǎn)品及解決方案,并預(yù)覽了針對邊緣側(cè)的英特爾? 酷睿? Ultra處理器(
    的頭像 發(fā)表于 11-19 21:51 ?6770次閱讀
    <b class='flag-5'>英特爾</b>舉辦行業(yè)解決方案大會,共同打造機器人“芯”動脈

    硬件與應(yīng)用同頻共振,英特爾Day 0適配騰訊開源混元大模型

    今日,騰訊正式發(fā)布新一代混元開源大語言模型。英特爾憑借在人工智能領(lǐng)域的全棧技術(shù)布局,現(xiàn)已在英特爾? 酷睿? Ultra 平臺上完成針對該模型的第零日(Day 0)部署與性能優(yōu)化。值得一提的是, 依托
    的頭像 發(fā)表于 08-07 14:42 ?1367次閱讀
    硬件與應(yīng)用同頻共振,<b class='flag-5'>英特爾</b>Day 0適配騰訊開源混元大模型

    使用英特爾? NPU 插件C++運行應(yīng)用程序時出現(xiàn)錯誤:“std::Runtime_error at memory location”怎么解決?

    使用OpenVINO?工具套件版本 2024.4.0 構(gòu)建C++應(yīng)用程序 使用英特爾? NPU 插件運行了 C++ 應(yīng)用程序 遇到的錯誤: Microsoft C++ exception: std::runtime_error at memory location
    發(fā)表于 06-25 08:01

    英特爾發(fā)布邊緣AI控制器與邊緣智算一體機,創(chuàng)造“AI新視界”

    在2025北京機器視覺展覽會(VisionChina)以“AI 視界:英特爾推動智能制造革新浪潮”為主題的英特爾論壇中,英特爾與諾達佳聯(lián)合發(fā)布了 基于
    發(fā)表于 06-24 17:50 ?1517次閱讀
    <b class='flag-5'>英特爾</b><b class='flag-5'>發(fā)布</b>邊緣AI控制器與邊緣智算一體機,創(chuàng)造“AI新視界”

    無法將Openvino? 2025.0與onnx運行時Openvino? 執(zhí)行提供程序 1.16.2 結(jié)合使用,怎么處理?

    使用OpenVINO?與英特爾 i5-8500 CPU 和超核處理器 630 iGPU 一起部署模型。 使用了 Microsoft.ML.OnnxRuntime.OpenVino
    發(fā)表于 06-24 06:31

    為什么無法通過“pip install openvino-dev==2025.0.0”安裝 2025.0 OpenVINO??

    通過“pip install openvino-dev==2025.0.0OpenVINO? 2025.0 安裝。 收到的錯誤: ERROR: No matching distribution found for
    發(fā)表于 06-23 08:13

    英特爾銳炫Pro B系列,邊緣AI的“智能引擎”

    2025年6月19日,上?!?在MWC 25上海期間,英特爾展示了一幅由英特爾銳炫? Pro B系列GPU所驅(qū)動的“實時響應(yīng)、安全高效、成本可控”的邊緣AI圖景。 英特爾客戶端計算事業(yè)部邊緣計算
    的頭像 發(fā)表于 06-20 17:32 ?896次閱讀
    <b class='flag-5'>英特爾</b>銳炫Pro B系列,邊緣AI的“智能引擎”

    直擊Computex 2025:英特爾重磅發(fā)布新一代GPU,圖形和AI性能躍升3.4倍

    電子發(fā)燒友原創(chuàng)? 章鷹 5月19日,在Computex 2025上,英特爾發(fā)布了最新全新圖形處理器(GPU)和AI加速器產(chǎn)品系列。包括全新英特爾銳炫? Pro B系列GPU——英特爾
    的頭像 發(fā)表于 05-21 00:57 ?7478次閱讀
    直擊Computex 2025:<b class='flag-5'>英特爾</b>重磅<b class='flag-5'>發(fā)布</b>新一代GPU,圖形和AI性能躍升3.4倍

    直擊Computex2025:英特爾重磅發(fā)布新一代GPU,圖形和AI性能躍升3.4倍

    5月19日,在Computex 2025上,英特爾發(fā)布了最新全新圖形處理器(GPU)和AI加速器產(chǎn)品系列。包括全新英特爾銳炫? Pro B系列GPU——英特爾銳炫Pro B60和
    的頭像 發(fā)表于 05-20 12:27 ?5452次閱讀
    直擊Computex2025:<b class='flag-5'>英特爾</b>重磅<b class='flag-5'>發(fā)布</b>新一代GPU,圖形和AI性能躍升3.4倍

    英特爾發(fā)布全新GPU,AI和工作站迎來新選擇

    英特爾推出面向準專業(yè)用戶和AI開發(fā)者的英特爾銳炫Pro GPU系列,發(fā)布英特爾? Gaudi 3 AI加速器機架級和PCIe部署方案 ? 2025 年 5 月 19 日,北京 ——今日
    發(fā)表于 05-20 11:03 ?1845次閱讀

    Intel OpenVINO? Day0 實現(xiàn)阿里通義 Qwen3 快速部署

    本文將以 Qwen3-8B 為例,介紹如何利用 OpenVINO 的 Python API 在英特爾平臺(GPU, NPU)Qwen3 系列模型。
    的頭像 發(fā)表于 05-11 11:36 ?1717次閱讀
    Intel <b class='flag-5'>OpenVINO</b>? Day0 實現(xiàn)阿里通義 Qwen3 快速部署

    英特爾OpenVINO 2025.1版本發(fā)布

    我們很高興地宣布 OpenVINO 2025 的最新版本正式發(fā)布!本次更新帶來了來自工程團隊的更多增強功能和新特性。每一次發(fā)布,我們都在不斷適應(yīng)日新月異的 AI 發(fā)展趨勢,迎接層出不窮的新機遇與復(fù)雜
    的頭像 發(fā)表于 04-29 09:27 ?1144次閱讀

    英特爾宣布裁員20% 或2萬人失業(yè)

    據(jù)外媒彭博社的報道,在當?shù)貢r間4月24日,英特爾宣布裁員計劃,比例超20%。按照截至2024年底英特爾在全球擁有108900名員工來計算的話,預(yù)計此次裁員將波及大約2.2萬名員工。旨在精簡管理,并重
    的頭像 發(fā)表于 04-25 17:34 ?622次閱讀

    英特爾首秀上海車展:以“芯”賦能,攜手合作伙伴推動全車智能化

    4月23日,在上海車展上,英特爾發(fā)布第二代英特爾AI增強軟件定義汽車(SDV)SoC,并披露全新合作伙伴關(guān)系。第二代英特爾AI增強SDV SoC率先在汽車行業(yè)推出基于芯粒架構(gòu)的設(shè)計,進
    的頭像 發(fā)表于 04-23 21:20 ?1324次閱讀
    <b class='flag-5'>英特爾</b>首秀上海車展:以“芯”賦能,攜手合作伙伴推動全車智能化

    英特爾發(fā)布最強大的商用AI PC產(chǎn)品陣容

    在2025年世界移動通信大會(MWC 2025)上,英特爾發(fā)布了該公司迄今為止最強大的商用AI PC產(chǎn)品陣容,搭載了英特爾 酷睿 Ultra 200V、200U、200H、200HX和200S系列
    的頭像 發(fā)表于 03-08 09:28 ?1186次閱讀