零門檻體驗(yàn)DeepSeek-R1滿血版本,性能對(duì)標(biāo)OpenAI o1,即刻開(kāi)啟一場(chǎng)震撼人心的AI探索之旅。
如果您是開(kāi)發(fā)者,將需要使用DeepSeek API。注冊(cè)成為PerfXCloud用戶,即贈(zèng)送2千萬(wàn)token!本服務(wù)獲得了中國(guó)曙光、超算互聯(lián)網(wǎng)、沐曦的大力支持和算力支撐。澎峰科技+海光DCU:自研推理框架全面支持DeepSeek系列模型
DeepSeek-R1滿血版本和蒸餾版本的差異
滿血版是與DeepSeek官網(wǎng)性能一致的V3和R1的全量參數(shù)模型,一般需要多臺(tái)高性能GPU服務(wù)器并行才能流暢運(yùn)行推理服務(wù),低配也要數(shù)百萬(wàn)人民幣。而蒸餾版是利用DeepSeek-R1生成的數(shù)據(jù)對(duì)其他模型進(jìn)行微調(diào),從而提升其模型性能,但效果差于滿血版。DeepSeek-R1滿血版本性能對(duì)標(biāo)OpenAI o1商業(yè)版本水平,但價(jià)格只是它的1/30。
舉例參數(shù)規(guī)模和模型大小:
DeepSeek-R1:參數(shù)為 671B,模型大小約 720G。
DeepSeek-R1-Distill-Qwen-7B:參數(shù)為 7B,模型大小約 15G。
DeepSeek-R1-Distill-Llama-8B:參數(shù)為 8B,模型大小約 16G。
DeepSeek-R1-Distill-Qwen-32B:參數(shù)為 32B,模型大小約 75G。
【關(guān)于我們】
澎峰科技核心團(tuán)隊(duì)來(lái)自中國(guó)科學(xué)院,張先軼博士任公司創(chuàng)始人兼CEO,是國(guó)際知名開(kāi)源矩陣計(jì)算項(xiàng)目OpenBLAS發(fā)起人和主要維護(hù)者。
公司于2021年研發(fā)出中國(guó)國(guó)內(nèi)首款異構(gòu)計(jì)算服務(wù)平臺(tái),已經(jīng)為華為、海光、沐曦、天數(shù)、燧原、寒武紀(jì)、平頭哥等眾多國(guó)產(chǎn)芯片企業(yè)提供極致性能的數(shù)學(xué)計(jì)算庫(kù)(Math Kernel Library)和算子優(yōu)化服務(wù)(Operator Optimization),并與國(guó)家超級(jí)計(jì)算天津中心、國(guó)家超級(jí)計(jì)算西安中心、國(guó)家超級(jí)計(jì)算長(zhǎng)沙中心,湖南智算中心、宜昌智算中心等多個(gè)算力中心部署,為計(jì)算加速,為生態(tài)賦能。
2025年02月03日,澎峰科技以最快速度一次性使用自研的PerfXLM完成四款國(guó)產(chǎn)加速卡對(duì)DeepSeek的適配,展示了強(qiáng)大的異構(gòu)計(jì)算加速技術(shù)。
2021年,澎峰科技就發(fā)布了中國(guó)國(guó)內(nèi)首個(gè)自主研發(fā)的異構(gòu)計(jì)算軟件棧,為國(guó)產(chǎn)加速卡跳過(guò)NVIDIA CUDA護(hù)城河做出了卓越貢獻(xiàn),2021年4月23日,在數(shù)字中國(guó)集成電路賽道特等獎(jiǎng)。PerfXLM 推理框架強(qiáng)勢(shì)支持 DeepSeek 全系列模型,AI 推理性能再攀高峰!
十年磨一劍,今朝綻鋒芒! PerfXCloud-DeepSeek專線解決方案簡(jiǎn)介
極致性能:澎湃算力,引領(lǐng)行業(yè)之巔
PerfXCloud DeepSeek 滿血專線,依托澎峰科技 PerfXCloud 大模型開(kāi)發(fā)服務(wù)平臺(tái)上線MoE架構(gòu)的671B全量DeepSeek-R1/V3模型,以及DeepSeek-R1的蒸餾系列模型,并提供私有化部署方案。
依托澎峰搭載自研 PerfXLM 推理引擎,對(duì) DeepSeek-R1 滿血模型進(jìn)行深度優(yōu)化。它以無(wú)與倫比的推理速度和卓越的能效比,重新定義了 AI 性能的行業(yè)標(biāo)準(zhǔn),為您的每一次計(jì)算需求提供強(qiáng)勁動(dòng)力,助力您在 AI 世界中暢行無(wú)阻。
穩(wěn)定可靠:堅(jiān)如磐石,護(hù)航業(yè)務(wù)全程
憑借澎峰科技強(qiáng)大的 AI-Infra 能力,PerfXCloud-DeepSeek 滿血專線構(gòu)建了堅(jiān)不可摧的服務(wù)架構(gòu)。無(wú)論您的業(yè)務(wù)需求如何波動(dòng),它都能以穩(wěn)定可靠的服務(wù)質(zhì)量,為您的每一次運(yùn)算保駕護(hù)航,確保您的業(yè)務(wù)在 AI 的賦能下穩(wěn)健前行,無(wú)懼任何挑戰(zhàn)。適用場(chǎng)景:多元賦能,助力各領(lǐng)域突破。
對(duì)于追求極致效率的 AI 開(kāi)發(fā)者而言,PerfXCloud DeepSeek 滿血專線是加速創(chuàng)新的利器,提供豐富的模型選擇,超低的token價(jià)格。助您在激烈的 AI 競(jìng)技場(chǎng)中脫穎而出,引領(lǐng)技術(shù)潮流。
企業(yè)用戶
我們?yōu)槠髽I(yè)用戶提供DeepSeek專線解決方案,從方案咨詢、規(guī)劃、設(shè)計(jì)與實(shí)施一條龍服務(wù)。幫助企業(yè)輕松實(shí)現(xiàn) AI 賦能,無(wú)縫融入業(yè)務(wù)流程。它將為您的業(yè)務(wù)注入強(qiáng)大動(dòng)
力,賦能業(yè)務(wù)創(chuàng)新,提升企業(yè)競(jìng)爭(zhēng)力,助力企業(yè)在數(shù)字化轉(zhuǎn)型的浪潮中乘風(fēng)破浪,開(kāi)拓新局。
教育科研機(jī)構(gòu)
我們?yōu)榻逃蒲袡C(jī)構(gòu)提供DeepSeek虛擬專線、私有化算力部署服務(wù),課題合作,向教育行業(yè)提供DeepSeek實(shí)訓(xùn)平臺(tái)和課程體系。幫助您立即使用DeepSeek大語(yǔ)言模型強(qiáng)大能力,高效開(kāi)展前沿 AI 研究,快速賦能人才培養(yǎng),抓住百年未有之大變局的機(jī)遇,極速提升競(jìng)爭(zhēng)力。
-
AI
+關(guān)注
關(guān)注
89文章
38004瀏覽量
295949 -
澎峰科技
+關(guān)注
關(guān)注
0文章
77瀏覽量
3579 -
DeepSeek
+關(guān)注
關(guān)注
2文章
822瀏覽量
2790
原文標(biāo)題:PerfXCloud DeepSeek滿血專線,立即體驗(yàn)!澎峰科技”十年磨一劍,今朝綻鋒芒“
文章出處:【微信號(hào):perfxlab,微信公眾號(hào):perfxlab】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
【「DeepSeek 核心技術(shù)揭秘」閱讀體驗(yàn)】--全書(shū)概覽
RK3588開(kāi)發(fā)板上部署DeepSeek-R1大模型的完整指南
商湯大裝置DeepSeek企業(yè)版上線
中軟國(guó)際攜手華為云助力北京昌平上線DeepSeek政務(wù)大模型
了解DeepSeek-V3 和 DeepSeek-R1兩個(gè)大模型的不同定位和應(yīng)用選擇
天數(shù)智芯加速DeepSeek全系列模型適配
阿里云上線DeepSeek六大模型,贈(zèng)送百萬(wàn)免費(fèi)tokens
騰訊云率先上線DeepSeek模型API接口,支持聯(lián)網(wǎng)搜索
軟通動(dòng)力天元智算接入DeepSeek系列模型
中軟國(guó)際科創(chuàng)中心上線DeepSeek模型
DeepSeek-R1全尺寸版本上線Gitee AI
騰訊云TI平臺(tái)推出DeepSeek系列模型
京東云正式上線DeepSeek系列模型
云天勵(lì)飛上線DeepSeek R1系列模型

PerfXCloud上線DeepSeek系列模型
評(píng)論