隨著人工智能技術(shù)的迅速發(fā)展,傳統(tǒng)的個(gè)人電腦已經(jīng)面臨升級(jí)的需求。AI PC時(shí)代,如何能使大模型更好地服務(wù)企業(yè)和個(gè)人?中科創(chuàng)達(dá)交出了第一份答卷。
近日,中科創(chuàng)達(dá)憑借其在終端、邊緣計(jì)算領(lǐng)域的多年技術(shù)沉淀以及在大模型領(lǐng)域的創(chuàng)新探索,利用模型壓縮、分布式以及張量并行技術(shù),成功在搭載了高通8系列芯片平臺(tái)的邊緣設(shè)備上實(shí)現(xiàn)了LLaMA-2 130億參數(shù)模型的穩(wěn)定運(yùn)行,成為業(yè)內(nèi)首家取得此突破的大模型企業(yè)。這一創(chuàng)舉將使得端側(cè)設(shè)備能夠運(yùn)行更大參數(shù)的模型,同時(shí)提高了端側(cè)設(shè)備的推理速度,為大模型在端側(cè)的應(yīng)用奠定了堅(jiān)實(shí)的基礎(chǔ)。
模型壓縮及張量并行技術(shù)提升端側(cè)AI效率
自今年3月份ChatGPT-3對(duì)外開(kāi)放以來(lái),大模型及其應(yīng)用以極其驚人的發(fā)展速度席卷全球,由此帶來(lái)了對(duì)于算力需求的急速攀升。云端算力面臨成本和供給壓力,無(wú)法滿(mǎn)足AI算力需求,端側(cè)AI為這一難題提供了解決方案。隨著高通、Intel等芯片廠商陸續(xù)發(fā)布具有更高算力并支持生成式AI的終端芯片,AI PC時(shí)代拉開(kāi)序幕。
AI PC作為終端、邊緣與云技術(shù)融合的創(chuàng)新產(chǎn)物,具有成本、時(shí)延和隱私方面的天然優(yōu)勢(shì),可以作為云端算力的補(bǔ)充。在即將到來(lái)的AI PC時(shí)代,中科創(chuàng)達(dá)將能夠充分發(fā)揮自身在終端、操作系統(tǒng)、邊緣計(jì)算、軟件以及生態(tài)合作方面的優(yōu)勢(shì),助力品牌商和開(kāi)發(fā)者抓住行業(yè)轉(zhuǎn)型的契機(jī),為終端用戶(hù)帶來(lái)在辦公、娛樂(lè)、學(xué)習(xí)等多場(chǎng)景下的更為高效便捷的體驗(yàn)。
邊緣AI加速大模型在B端落地應(yīng)用
此次中科創(chuàng)達(dá)的成功實(shí)踐不僅驗(yàn)證了13B大模型在端側(cè)的落地,也為大模型在邊緣的應(yīng)用打開(kāi)了新的可能性。以往,大型模型主要在云端進(jìn)行訓(xùn)練和推理,而現(xiàn)在,邊緣設(shè)備也能夠勝任更大參數(shù)的模型。這將為各行各業(yè)帶來(lái)更多的機(jī)會(huì)和挑戰(zhàn),無(wú)論是語(yǔ)音識(shí)別、圖像處理還是自然語(yǔ)言處理,都能夠受益于這一創(chuàng)新。
未來(lái),AI將以端云協(xié)同的模式,即云端進(jìn)行模型訓(xùn)練,而推理則集中在離數(shù)據(jù)產(chǎn)生距離更近的端側(cè)及邊緣側(cè)進(jìn)行,有效緩解AI算力不足的需求和缺口。由此加速大模型應(yīng)用在智能駕駛、具身智能、智能家居、智能物聯(lián)網(wǎng)等場(chǎng)景的落地。
審核編輯:彭菁
-
芯片
+關(guān)注
關(guān)注
463文章
54047瀏覽量
466559 -
高通
+關(guān)注
關(guān)注
78文章
7737瀏覽量
199915 -
人工智能
+關(guān)注
關(guān)注
1818文章
50126瀏覽量
265620 -
大模型
+關(guān)注
關(guān)注
2文章
3667瀏覽量
5197
原文標(biāo)題:AI PC時(shí)代,端側(cè)運(yùn)行130億參數(shù)模型,中科創(chuàng)達(dá)是如何做到的?
文章出處:【微信號(hào):THundersoft,微信公眾號(hào):ThunderSoft中科創(chuàng)達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
大模型服務(wù)為什么總是爆顯存
什么是企業(yè)云服務(wù)器-云計(jì)算
元服務(wù)發(fā)布配置開(kāi)發(fā)者服務(wù)信息
DeepSeek模型如何在云服務(wù)器上部署?
聆思大模型智能FAE,看得懂技術(shù),答得準(zhǔn)問(wèn)題
Cognizant加速AI模型企業(yè)級(jí)開(kāi)發(fā)
企業(yè)部署AI大模型怎么做
FA模型訪問(wèn)Stage模型DataShareExtensionAbility說(shuō)明
有償邀請(qǐng)企業(yè)或個(gè)人分析此圖,并提供分析報(bào)告
如何在RAKsmart服務(wù)器上實(shí)現(xiàn)企業(yè)AI模型部署
RAKsmart企業(yè)服務(wù)器上部署DeepSeek編寫(xiě)運(yùn)行代碼
數(shù)據(jù)標(biāo)注服務(wù)—奠定大模型訓(xùn)練的數(shù)據(jù)基石
標(biāo)貝數(shù)據(jù)標(biāo)注服務(wù):奠定大模型訓(xùn)練的數(shù)據(jù)基石
浪潮軟件率先推出政務(wù)服務(wù)大模型,重塑全場(chǎng)景應(yīng)用
如何能使大模型更好地服務(wù)企業(yè)和個(gè)人
評(píng)論