chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

華為OceanStor A800支持DeepSeek

華為數(shù)字中國(guó) ? 來(lái)源:華為數(shù)字中國(guó) ? 2025-02-18 10:09 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

人工智能技術(shù)迅猛發(fā)展的當(dāng)下,大模型的低成本與高性能成為各大科技企業(yè)競(jìng)相追逐的焦點(diǎn)。

近期火爆的DeepSeek-R1模型憑借低成本、高性能優(yōu)勢(shì)引發(fā)市場(chǎng)波動(dòng),DeepSeek-R1實(shí)力驚人,擁有6710億參數(shù),推理能力表現(xiàn)卓越,采用了慢思考+思維鏈,能對(duì)復(fù)雜問(wèn)題深入分析和推理,得出準(zhǔn)確且有邏輯的結(jié)論,這使其在處理數(shù)學(xué)計(jì)算、代碼編寫(xiě)、自然語(yǔ)言處理等各種任務(wù)時(shí)都游刃有余。

但是復(fù)雜推理的多輪對(duì)話(huà)和長(zhǎng)序列需要緩存更多的KV Cache,導(dǎo)致GPU高帶寬內(nèi)存容量成為瓶頸,而通過(guò)增加DRAM解決問(wèn)題又會(huì)讓推理成本激增。為了應(yīng)對(duì)上下文KV Cache緩存的問(wèn)題,DeepSeek采用創(chuàng)新性的硬盤(pán)緩存技術(shù),將GPU、DRAM中的緩存數(shù)據(jù)Offload到存儲(chǔ)陣列中,成功將大模型使用成本降低一個(gè)數(shù)量級(jí)。

在大模型推理過(guò)程中通過(guò)高性能分布式文件存儲(chǔ)以存代算,可以提升用戶(hù)體驗(yàn)與推理效率,同時(shí)有效降低推理成本。這一技術(shù)趨勢(shì)在DeepSeek API服務(wù)中大范圍應(yīng)用,其上下文硬盤(pán)緩存技術(shù)不僅能降低服務(wù)延遲,還可大幅削減最終的使用成本。

a222f38e-ed2a-11ef-9310-92fbcf53809c.png

DeepSeek API 模型&價(jià)格

(數(shù)據(jù)來(lái)源:https://api-docs.deepseek.com/zh-cn/quick_start/pricing)

從技術(shù)角度來(lái)看,在大模型API使用場(chǎng)景中,用戶(hù)輸入存在相當(dāng)比例的重復(fù)內(nèi)容,比如用戶(hù)的提問(wèn)中常有重復(fù)引用部分,多輪對(duì)話(huà)中每一輪都需重復(fù)輸入前幾輪內(nèi)容。同時(shí),在很多面向企業(yè)(ToB)的專(zhuān)業(yè)領(lǐng)域里,業(yè)務(wù)信息又多又復(fù)雜,常常是一長(zhǎng)串地輸入。推理時(shí)需要從這些長(zhǎng)上下文的內(nèi)容里找出有用的信息和關(guān)鍵主題,這就需要計(jì)算和存儲(chǔ)相互配合。為此,采用以存代算技術(shù),將預(yù)計(jì)未來(lái)會(huì)重復(fù)使用的內(nèi)容緩存在存儲(chǔ)中,當(dāng)輸入有重復(fù)時(shí),重復(fù)部分只需從緩存讀取,無(wú)需重新計(jì)算。這一技術(shù)不僅顯著降低服務(wù)延遲,還大幅削減最終使用成本。

以多輪對(duì)話(huà)場(chǎng)景為例,下一輪對(duì)話(huà)會(huì)命中上一輪對(duì)話(huà)生成的上下文緩存:

a23fa70e-ed2a-11ef-9310-92fbcf53809c.jpg

華為數(shù)據(jù)存儲(chǔ)OceanStor A800針對(duì)大模型推理具備Unified Cache多級(jí)緩存技術(shù),與DeepSeek硬盤(pán)緩存技術(shù)采用相同的技術(shù)路線(xiàn),簡(jiǎn)單來(lái)說(shuō),就是提前把和你相關(guān)的歷史信息,比如你們之前聊過(guò)的內(nèi)容、你的喜好這些“記憶”,存到的存儲(chǔ)設(shè)備里。等你要用的時(shí)候,它能快速找到這些相關(guān)信息(相關(guān)KV Cache片段),不用每次都從頭開(kāi)始推理計(jì)算。這樣一來(lái),不僅能快速準(zhǔn)確地處理長(zhǎng)對(duì)話(huà)內(nèi)容(長(zhǎng)序列),成本也能降下來(lái),而且還能根據(jù)你的獨(dú)特需求提供更貼心的個(gè)性化服務(wù),讓模型就像專(zhuān)門(mén)為你定制的一樣。

a2563910-ed2a-11ef-9310-92fbcf53809c.png

華為OceanStor A800是基于數(shù)控分離全交換架構(gòu)的原生AI存儲(chǔ),Unified Cache多級(jí)緩存技術(shù)可應(yīng)用于:

具有長(zhǎng)預(yù)設(shè)提示詞的問(wèn)答助手類(lèi)應(yīng)用,如智能客服、智能運(yùn)維;

具有角色設(shè)定與多輪對(duì)話(huà)的角色扮演類(lèi)應(yīng)用,如電商&教培、英語(yǔ)口語(yǔ)陪練;

超長(zhǎng)文本行業(yè)總結(jié)分析以及復(fù)雜推理等場(chǎng)景,如金融投研分析、法律卷宗分析;

針對(duì)固定文本集合進(jìn)行頻繁詢(xún)問(wèn)的數(shù)據(jù)分析類(lèi)應(yīng)用;

代碼倉(cāng)庫(kù)級(jí)別的代碼分析與排障工具。

為推理系統(tǒng)提供TB級(jí)性能、PB級(jí)容量、大規(guī)模共享的全局內(nèi)存擴(kuò)展池,實(shí)現(xiàn)高效的上下文KV Cache保存、管理與加載策略,有效提升KV Cache加載效率,可支持的序列長(zhǎng)度從百K擴(kuò)展到無(wú)限長(zhǎng),實(shí)現(xiàn)推理首Token時(shí)延4+倍降低,E2E推理成本2+倍降低,為大模型提供終身記憶和無(wú)限上下文能力。

a26a275e-ed2a-11ef-9310-92fbcf53809c.png

大模型推理使用華為OceanStor A800高性能分布式文件存儲(chǔ),能夠?qū)崿F(xiàn)PB級(jí)容量的DRAM性能,進(jìn)一步降低大模型推理服務(wù)的延遲,大幅削減最終使用成本,重新定義了AI服務(wù)的性?xún)r(jià)比,為大模型在各行業(yè)的廣泛普及與應(yīng)用注入強(qiáng)大動(dòng)力,加速大模型普惠時(shí)代的到來(lái)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 華為
    +關(guān)注

    關(guān)注

    217

    文章

    35772

    瀏覽量

    260609
  • 硬盤(pán)
    +關(guān)注

    關(guān)注

    3

    文章

    1354

    瀏覽量

    59559
  • DeepSeek
    +關(guān)注

    關(guān)注

    2

    文章

    822

    瀏覽量

    2790

原文標(biāo)題:華為OceanStor A800支持DeepSeek硬盤(pán)緩存技術(shù),重新定義AI性?xún)r(jià)比

文章出處:【微信號(hào):HWS_yunfuwu,微信公眾號(hào):華為數(shù)字中國(guó)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    請(qǐng)問(wèn)CW32F003支持printf函數(shù)嗎?

    CW32F003支持printf函數(shù)嗎?
    發(fā)表于 11-21 07:48

    CW32L011支持哪些實(shí)時(shí)操作系統(tǒng)?

    CW32L011支持哪些實(shí)時(shí)操作系統(tǒng)?
    發(fā)表于 11-17 06:51

    stm32支持canfd和dma結(jié)合使用嗎?

    stm32支持canfd和dma結(jié)合使用嗎
    發(fā)表于 08-01 07:15

    華為Mate 80支持eSIM 華為重回世界500強(qiáng)前100

    給大家?guī)?lái)華為的最新消息: 曝華為Mate 80支持eSIM 華為Mate 80一直備受關(guān)注,據(jù)數(shù)碼博主“智慧皮卡丘”微博爆料稱(chēng):“低軌衛(wèi)星通訊+eSIM,新的通訊架構(gòu)”,并帶上了“
    的頭像 發(fā)表于 07-30 14:40 ?895次閱讀

    K230支持ONVIF上傳視頻嗎?

    K230支持ONVIF上傳視頻嗎
    發(fā)表于 06-20 07:11

    DeepSeek推動(dòng)AI算力需求:800G光模塊的關(guān)鍵作用

    限制算力提升的瓶頸。800G光模塊通過(guò)更高的傳輸速率,能夠支持大規(guī)模GPU集群間的數(shù)據(jù)傳輸,保證各節(jié)點(diǎn)之間的快速互聯(lián)和低延遲通信,從而提升整個(gè)系統(tǒng)的計(jì)算效率與吞吐量。對(duì)于DeepSeek等超大模型
    發(fā)表于 03-25 12:00

    請(qǐng)問(wèn)STM32CubeIDE v1.16.1支持代碼補(bǔ)全功能嗎?如何開(kāi)啟呢?

    STM32CubeIDE v1.16.1支持代碼補(bǔ)全功能嗎?如何開(kāi)啟呢?
    發(fā)表于 03-14 06:47

    HarmonyOS NEXT開(kāi)發(fā)實(shí)戰(zhàn):DevEco Studio中DeepSeek的使用

    隨著HarmonyOS Next的持續(xù)發(fā)布,鴻蒙系統(tǒng)對(duì)AI能力的支持顯著增強(qiáng)。本文將深入探討如何在鴻蒙應(yīng)用中集成AI模型,結(jié)合接入DeepSeek,一起來(lái)探索開(kāi)發(fā)鴻蒙原生應(yīng)用的更多可能吧! 第一步
    發(fā)表于 03-07 14:56

    請(qǐng)問(wèn)ADS1255/6支持菊花鏈嗎?

    ADS1255/6支持菊花鏈嗎?連接方法是否同ADS1271?菊花鏈連接以后各ADC是否同步采集,順序輸出數(shù)據(jù)?
    發(fā)表于 02-12 06:05

    華為ModelEngine AI平臺(tái)全面支持DeepSeek

    在全球人工智能技術(shù)飛速發(fā)展的今天,模型的快速迭代與高效部署成為各大科技企業(yè)競(jìng)相追逐的焦點(diǎn)。華為DCS AI全棧解決方案中的重要產(chǎn)品—ModelEngine AI平臺(tái),全面支持DeepSeek大模型R1&V3和蒸餾系列模型的本地部
    的頭像 發(fā)表于 02-07 10:24 ?1893次閱讀
    <b class='flag-5'>華為</b>ModelEngine AI平臺(tái)全面<b class='flag-5'>支持</b><b class='flag-5'>DeepSeek</b>

    請(qǐng)問(wèn)ads1256支持8路的采樣率是多少?

    ads1256支持30KSPS,這個(gè)怎么理解呀。是8路,每路都支持30K的采樣率嗎? 我這有個(gè)需求,8路,每路的采樣率至少2K,能否支持?
    發(fā)表于 12-31 06:59

    電平轉(zhuǎn)換SN74LVCH16T245支持多大頻率?20Mhz可以支持嗎?

    您好,請(qǐng)問(wèn)TI電平轉(zhuǎn)換SN74LVCH16T245支持多大頻率?20Mhz可以支持嗎? 手冊(cè)中描述的PRR<10Mhz是指什么?
    發(fā)表于 12-30 07:51

    P82B96支持HDCP嗎?

    你好:我用P89B96用做HDMI的DDC通道的I2C的轉(zhuǎn)換,我現(xiàn)在是解決了II2問(wèn)題,但是它里面有個(gè)HDCP保護(hù)協(xié)議通過(guò)DDC通道,感覺(jué)它有延時(shí)一樣,不穩(wěn)定。請(qǐng)問(wèn)是否用P82B96支持HDCP?
    發(fā)表于 12-27 07:01

    ADS1256支持菊花鏈連接嗎?

    求助:1、ADS1256支持菊花鏈連接嗎? 2、如果不支持菊花鏈連接,能否把多片ADS1256掛在同一個(gè)SPI(CLK,MISO,MOSI)總線(xiàn)上,通過(guò)不同的CS來(lái)選擇芯片? 3、多片ADS1256能否支持廣播,來(lái)啟動(dòng)所有芯片
    發(fā)表于 12-24 06:03

    DS92LV2421支持最長(zhǎng)的傳輸距離只有10m嗎?

    DS92LV2421支持最長(zhǎng)的傳輸距離只有10m嗎
    發(fā)表于 12-03 08:11