chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

在AI基礎設施中部署大語言模型的三大舉措

穎脈Imgtec ? 2026-02-09 16:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

文:Gartner研究副總裁周玲


中國企業(yè)機構已逐步在生產(chǎn)環(huán)境中運行或者計劃運行大語言模型,但在AI基礎設施的生產(chǎn)部署與高效運營方面仍面臨諸多挑戰(zhàn)。目前,中國正加速提升其生成式AI能力,覆蓋大語言模型、軟件開發(fā)、生態(tài)集成與硬件革新。隨著DeepSeek、通義千問(Qwen)等高性價比模型日益普及和本地部署的深入推進,越來越多的中國企業(yè)將重心放在數(shù)據(jù)隱私、數(shù)據(jù)主權、安全性、可擴展性和低延遲等核心需求上。2025年Gartner首席信息官(CIO)和技術高管調(diào)研顯示,2025年中國企業(yè)計劃大幅增加在生成式AI和AI領域的技術投資,其平均增幅分別達到40.3%和33.3%(見圖1),這一數(shù)據(jù)表明,相關技術將在短期內(nèi)得到廣泛采用。

3e6abd4c-0591-11f1-96ea-92fbcf53809c.png

Gartner預測,到2028年,中國70%的大型企業(yè)將為大語言模型在AI基礎設施上的部署建立完善的治理框架,而2025年這一比例不足10%。

然而,要成功實現(xiàn)大語言模型在AI基礎設施中的生產(chǎn)部署并非易事,需要制定復雜的技術、運維和治理戰(zhàn)略,以確保模型達到性能指標(例如GPU算力利用率),同時保障數(shù)據(jù)安全與合規(guī)。

中國企業(yè)與全球企業(yè)的一個關鍵區(qū)別在于,其更傾向于在本地AI基礎設施環(huán)境中部署大語言模型,這對I&O團隊提出了更高要求,需要他們對重要AI基礎設施技術棧有更深入的理解。AI基礎設施是指AI應用構建、測試、訓練與部署所需的最新、最先進的硬軟件技術棧。

為了在新的AI基礎設施上成功實現(xiàn)大語言模型的生產(chǎn)部署,企業(yè)應從以下三個方面著手:構建全面的生產(chǎn)發(fā)布策略;制定健全的治理框架;并加強與法律、安全、AI、數(shù)據(jù)團隊及生態(tài)伙伴的緊密協(xié)作。這些舉措為大語言模型在生產(chǎn)環(huán)境中的高效運行提供了堅實的保障。


構建全面的部署戰(zhàn)略

隨著企業(yè)開始在AI基礎設施上部署大語言模型,I&O領導者所面臨的壓力日益增大,需要幫助AI開發(fā)人員和工程師在全企業(yè)范圍內(nèi)以更快的速度、更大的規(guī)模來推進AI項目的開發(fā)和部署。與此同時,針對不同用戶和應用場景不斷涌現(xiàn)的各種AI工具和服務,顯著增加了評估與選擇的難度和復雜性。此外,傳統(tǒng)的生產(chǎn)發(fā)布策略與流程已無法有效支持大語言模型在AI基礎設施中的生產(chǎn)部署需求。因此,I&O領導者亟需制定完善的生產(chǎn)發(fā)布戰(zhàn)略,以保障部署工作的順利進行。

然而,要為大語言模型在AI基礎設施上的部署構建一套穩(wěn)健的戰(zhàn)略,就需要從整體視角出發(fā),包括適配AI基礎設施環(huán)境、為特定場景設計架構、實施技術優(yōu)化以及確保符合監(jiān)管框架要求。

中國的I&O領導者應:

使部署策略與企業(yè)數(shù)字化轉(zhuǎn)型戰(zhàn)略保持一致

按照使用場景構建多層次部署架構以優(yōu)化性能

優(yōu)化模型與推理以提升效率

使用云原生技術實現(xiàn)靈活調(diào)度

加強合規(guī)并強化安全管理

建立全鏈路監(jiān)控與成本控制機制


制定穩(wěn)健的部署治理流程

大語言模型已經(jīng)從研究原型轉(zhuǎn)變?yōu)槎喾N任務的關鍵核心組件,包括客戶支持AI智能體、法律文檔摘要、代碼生成或測試工具、企業(yè)級代理型AI用例以及多模態(tài)應用等領域。然而,大語言模型在AI基礎設施中的生產(chǎn)部署需要解決如下幾個固有挑戰(zhàn):

資源密集

非確定性行為與提示敏感

延遲與吞吐限制

安全與隱私

因此,為了成功將大語言模型部署到AI基礎設施的生產(chǎn)環(huán)境中,中國的I&O部門必須建立一套穩(wěn)健的治理流程,采取切實可行的步驟促進資源管理、持續(xù)監(jiān)控以及敏捷更新。比如:

提前規(guī)劃并進行試點

確定產(chǎn)品部署位置

建立高效的資源管理

在大語言模型生產(chǎn)發(fā)布流程中嵌入安全治理與提示治理

管理版本并執(zhí)行A/B測試

采用持續(xù)集成/持續(xù)交付流程

實施生產(chǎn)監(jiān)控


促進關鍵利益相關方之間的緊密協(xié)作

部署大語言模型十分復雜,要求業(yè)務、法務、安全以及AI與數(shù)據(jù)團隊以協(xié)同一致的方式共同工作。過去各自獨立的部門如今必須從大語言模型項目的啟動階段就開展合作,以確保技術開發(fā)能夠反映法律和安全方面的考量。建立跨職能的AI治理委員會至關重要,成員應包括法務、安全、數(shù)據(jù)工程與數(shù)據(jù)科學、產(chǎn)品管理、軟件開發(fā)以及高管層的代表。

文章來源:Gartner

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    91

    文章

    39911

    瀏覽量

    301538
  • 人工智能
    +關注

    關注

    1817

    文章

    50115

    瀏覽量

    265576
  • 語言模型
    +關注

    關注

    0

    文章

    572

    瀏覽量

    11323
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    為何CPU是AI基礎設施的核心

    人工智能 (AI) 并非一種具有單一理想基礎設施的單一工作負載。AI 涵蓋了多樣化的工作負載,需要系統(tǒng)層面的協(xié)同策略,才能高效且可擴展地提供性能。而在這一策略中,CPU 扮演著核心角色,它作為系統(tǒng)的智能層,統(tǒng)籌協(xié)調(diào)云端、數(shù)據(jù)中心
    的頭像 發(fā)表于 03-11 10:35 ?202次閱讀

    華為推動電信云加速向AI基礎設施演進

    隨著AI技術持續(xù)突破,人工智能正成為全球產(chǎn)業(yè)升級的核心驅(qū)動力。從通用大模型到行業(yè)智能應用,AI已成為新一輪科技變革和產(chǎn)業(yè)升級的核心驅(qū)動力。業(yè)界正加快推進體系化探索,圍繞AI
    的頭像 發(fā)表于 02-27 09:43 ?238次閱讀

    模型 ai coding 比較

    方裁判更客觀 樣本量說明:當前樣本量30題,統(tǒng)計意義有限,建議后續(xù)擴大到100+題 數(shù)據(jù)污染風險:評估經(jīng)典題目被模型訓練集見過的可能性 6. 環(huán)境一致性維度 所有模型完全相同的環(huán)
    發(fā)表于 02-19 13:43

    AI端側(cè)部署開發(fā)(SC171開發(fā)套件V3)2026版

    AI端側(cè)部署開發(fā)(SC171開發(fā)套件V3)2026版 序列 課程名稱 視頻課程時長 視頻課程鏈接 課件鏈接 工程源碼 1 Fibo AI Stack模型轉(zhuǎn)化指南 27分19秒 http
    發(fā)表于 01-15 10:31

    亞馬遜云科技推出全新的Amazon AI Factories 將客戶現(xiàn)有基礎設施轉(zhuǎn)化為高性能AI環(huán)境

    亞馬遜云科技2025 re:Invent全球大會上,宣布推出全新的Amazon AI Factories,助力企業(yè)將現(xiàn)有基礎設施轉(zhuǎn)化為高性能的AI環(huán)境。
    的頭像 發(fā)表于 12-13 13:44 ?736次閱讀

    使用瑞薩RUHMI工具實現(xiàn)AI模型部署過程

    AI無處不在。你部署AI,你的競爭對手也部署AI
    的頭像 發(fā)表于 10-17 10:00 ?2795次閱讀
    使用瑞薩RUHMI工具實現(xiàn)<b class='flag-5'>AI</b><b class='flag-5'>模型</b><b class='flag-5'>部署</b>過程

    科士達全棧解決方案亮相2025 ODCC,驅(qū)動綠色AI智算基礎設施革新

    2025年開放數(shù)據(jù)中心大會(ODCC)于9月9日-11日北京國際會議中心盛大啟幕。本屆峰會以“擁抱AI變革,點燃算網(wǎng)引擎”為主題,聚焦AI爆發(fā)背景下算力基礎設施面臨的能效、
    的頭像 發(fā)表于 09-17 15:40 ?1259次閱讀
    科士達全棧解決方案亮相2025 ODCC,驅(qū)動綠色<b class='flag-5'>AI</b>智算<b class='flag-5'>基礎設施</b>革新

    ai_cube訓練模型最后部署失敗是什么原因?

    ai_cube訓練模型最后部署失敗是什么原因?文件保存路徑里也沒有中文 查看AICube/AI_Cube.log,看看報什么錯?
    發(fā)表于 07-30 08:15

    摩爾線程“AI工廠”:以系統(tǒng)級創(chuàng)新定義新一代AI基礎設施

    演講中表示,為應對生成式AI爆發(fā)式增長下的大模型訓練效率瓶頸,摩爾線程將通過系統(tǒng)級工程創(chuàng)新,構建新一代AI訓練基礎設施,致力于為AGI時代打造生產(chǎn)先進
    發(fā)表于 07-28 10:34 ?2813次閱讀
    摩爾線程“<b class='flag-5'>AI</b>工廠”:以系統(tǒng)級創(chuàng)新定義新一代<b class='flag-5'>AI</b><b class='flag-5'>基礎設施</b>

    Arm如何助力AI基礎設施變革

    眾所周知,人工智能 (AI) 有望革新人類活動的方方面面。然而,要充分釋放這一潛力,就必須面對一個基本事實:支撐傳統(tǒng)計算的基礎設施已無法滿足未來 AI 發(fā)展的需求。
    的頭像 發(fā)表于 07-03 14:29 ?987次閱讀

    歐洲聯(lián)手NVIDIA打造AI基礎設施

    NVIDIA 于近日宣布,其正在攜手歐洲各國、科技和行業(yè)領導者,共同建造 NVIDIA Blackwell AI 基礎設施,以強化數(shù)字主權、支撐經(jīng)濟增長,并推動歐洲大陸成為 AI 工業(yè)革命的領導者。
    的頭像 發(fā)表于 06-16 14:25 ?1445次閱讀

    企業(yè)部署AI模型怎么做

    當下,AI模型已成為驅(qū)動決策自動化、服務智能化與產(chǎn)品創(chuàng)新的核心引擎。然而,企業(yè)面對動輒數(shù)百億參數(shù)的大模型部署時,常陷入算力不足、響應延遲高、成本失控等困境。如何突破瓶頸,實現(xiàn)高效、穩(wěn)
    的頭像 發(fā)表于 06-04 09:26 ?904次閱讀

    首創(chuàng)開源架構,天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應手

    模型全鏈路分析功能,針對AI應用開發(fā)的大痛點逐個擊破。 當前AI應用開發(fā)者使用開發(fā)工具時會面臨一個很頭疼的問題,種類多、功能不聚合、過
    發(fā)表于 04-13 19:52

    PoE交換機如何助力智慧城市基礎設施建設?

    簡化部署流程,降低基礎設施成本。借助PoE交換機,城市規(guī)劃者和網(wǎng)絡管理員可以高效位置部署設備,而無需受到電源插座可用性的限制。 PoE 交換機
    發(fā)表于 03-25 10:20

    英偉達與xAI簽AI基建協(xié)議 加入全球人工智能基礎設施投資合作伙伴聯(lián)盟

    共同發(fā)起。他們計劃建立300億美元的私募股權資本,并期望能夠撬動超1000億美元的投資;以共同建設數(shù)據(jù)中心和其他AI基礎設施。? 美東時間周,微軟和貝萊德宣布了一項重要合作事項;英
    的頭像 發(fā)表于 03-20 13:58 ?1171次閱讀