案例介紹
金山辦公與 NVIDIA 團隊合作,通過 NVIDIA Tensor Core GPU、TensorRT 提升圖像文檔識別與理解的推理效率;借助 NVIDIA Triton 推理服務器的部署,成功優(yōu)化 GPU 利用率,提供高推理吞吐量。
客戶簡介及應用背景
金山辦公是一家辦公軟件和服務提供商,主要從事 WPS Office 辦公軟件產品及服務的設計研發(fā)及銷售推?。產品包括 WPS Office 辦公軟件、???檔等協同辦公產品、圖像文檔識別與理解業(yè)務,可在 Windows、Linux、macOS、Android、iOS 、Harmony 等眾多主流操作平臺上應?,于全球也有越來越多的用戶樂享金山辦公提供的產品和服務。
在辦公場景中,文檔類型圖像被廣泛使用,比如證件、發(fā)票、合同、保險單、掃描書籍、拍攝的表格等,這類圖像包含了大量的純文本信息,還包含有表格、圖片、印章、手寫、公式等復雜的版面布局和結構信息。早前這些信息均采用人工來處理,需要耗費大量人力,很大程度上阻礙了企業(yè)的辦公效率 。其圖像文檔識別與內容理解業(yè)務就是為了解決此類用戶痛點。
自 2017 年以來的不斷耕耘,金山辦公在圖像文檔識別與理解領域已達到了國內領先水平。其主要使用了 CV(Computer Vision)與 VIE(Visual Information Extraction 視覺信息抽?。?等相關深度學習技術,例如通過 CV 技術識別發(fā)票和 PDF 大綱并獲取其中的數據關系,其日請求次數已達上億次。
客戶挑戰(zhàn)
圖像識別與理解是一個很復雜的過程,一個任務的 pipeline 用到的深度學習模型多達 20+ 個,且日請求量級較大(上億級別)需要大量的計算資源。當業(yè)務落地時,團隊主要面臨以下兩個挑戰(zhàn):
1、任務的絕對耗時不能過長。
2、成本問題。
應用方案
為了解決上訴的兩個挑戰(zhàn),金山辦公采用了 NVIDIA T4 Tensor Core GPU 進行推理、NVIDIA TensorRT 8.2.4 進行模型加速、NVIDIA Triton 推理服務器 22.04 在 K8S 上進行模型部署與編排。
長鏈路(多達 20+ 個模型的 pipeline)意味著長耗時,若基于 CPU 推理的話,pipeline 耗時會長達 15 秒左右,通過 GPU 推理和 TensorRT 加速,成功將耗時降低到了 2.4 秒左右。
模型部署的時候,常見的做法是推理與業(yè)務代碼(前后處理)放在一個進程空間里,每個模型需要在每個進程中加載一次,由于顯存的限制,很多時候難以得到較高的單卡 GPU 使用率。就算采用了進程池的方式提高了單卡的 GPU 利用率,也會因 CPU 的限制,出現機器整體的 GPU 利用率不高。而在引入了 Triton 推理服務器進行推理部署后,將推理與業(yè)務代碼解耦,初步實現將 GPU 資源池化調度。最終在同等業(yè)務規(guī)模情況下,部署成本節(jié)省了 23%。
模型耗時

表1 模型耗時
模型吞吐量對比圖



WPS 生成式 AI 的最新進展
WPS AI 緊跟業(yè)界潮流,再發(fā)布新 AI 能力,覆蓋文字、表格、PPT、PDF 四大辦公組件。這部分 AI 新能力集中在閱讀理解、問答、人機交互等方面。在 PPT 中,WPS AI 現已支持輸入主題,一鍵生成 PPT 演示文稿,并會根據用戶要求進行細化調節(jié),如更改主題風格、單頁美化、更改字體、更改配色、生成演講稿等等。
在 PDF 中,WPS 則展示了閱讀分析和理解能力。WPS AI 能夠閱讀包括論文、合同、課件等文檔,用戶以問答方式則可以獲得關鍵信息。并且,問答助手也會提供文檔溯源功能,確保用戶能夠得知信息來源。
用戶能夠通過手機等移動設備拍攝相關文檔,而后 WPS 給出相關翻譯、概括、分析等功能。
圖 1. WPS-AI 隨手拍與文檔問答

圖 2. WPS-AI 大綱生成
圖 3. WPS-AI PPT 美化
圖 4. WPS-AI PPT 生成
使用效果及影響
金山辦公圖像文檔識別與理解業(yè)務,通過采用 NVIDIA T4 Tensor Core GPU 及 TensorRT加速,相比于 CPU 其 pipleline 耗時共下降 84%;而采用 NVIDIA Triton 推理服務器部署,其部署成本節(jié)省了 23% 。
金山辦公 CV 團隊總監(jiān)熊龍飛表示:”我們有多個業(yè)務后邊的 AI 服務已經通過采用該方案提高了速度和資源利用率,不僅給用戶端帶去了更高的速度響應,提高了用戶體驗,也為公司節(jié)約了大量的服務端 GPU 資源,收獲了更高的效益。我們在文檔識別與理解領域的應用案例也可以啟發(fā)到 OCR 和版式識別領域的其他公司和學者,相信隨著更多客戶通過采用 TensorRT 加速會給行業(yè)帶來很大的收益。”
*本文中圖片均來源于金山辦公,如果您有任何疑問或需要使用本文中的圖片,請聯系金山辦公。
點擊“閱讀原文”,或掃描下方海報二維碼,觀看 NVIDIA 創(chuàng)始人兼 CEO 黃仁勛在 COMPUTEX 2023 的主題演講直播回放,主題演講中文字幕版已上線,了解 AI、圖形及其他領域的最新進展!
原文標題:NVIDIA GPU 加速 WPS Office AI 服務,助力打造優(yōu)質的用戶體驗
文章出處:【微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。
-
英偉達
+關注
關注
23文章
4084瀏覽量
99162
原文標題:NVIDIA GPU 加速 WPS Office AI 服務,助力打造優(yōu)質的用戶體驗
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
生命科學領先企業(yè)采用 NVIDIA BioNeMo 平臺加速 AI 驅動的藥物研發(fā)
NVIDIA RTX PRO 5000 Blackwell GPU的深度評測
利用NVIDIA Cosmos開放世界基礎模型加速物理AI開發(fā)
NVIDIA RTX PRO 2000 Blackwell GPU性能測試
NVIDIA硅光技術助力邁向百萬GPU AI工廠
NVIDIA全棧加速代理式AI應用落地
NVIDIA助力歐洲金融服務行業(yè)智能化發(fā)展
NVIDIA技術助力企業(yè)創(chuàng)建主權AI智能體
NVIDIA計劃打造全球首個工業(yè)AI云平臺
NVIDIA攜手諾和諾德借助AI加速藥物研發(fā)
使用NVIDIA RTX PRO Blackwell系列GPU加速AI開發(fā)
英偉達GTC2025亮點:Oracle與NVIDIA合作助力企業(yè)加速代理式AI推理
英偉達GTC25亮點:NVIDIA Dynamo開源庫加速并擴展AI推理模型
通用汽車和NVIDIA合作構建定制化AI系統
Oracle 與 NVIDIA 合作助力企業(yè)加速代理式 AI 推理
NVIDIA GPU 加速 WPS Office AI 服務,助力打造優(yōu)質的用戶體驗
評論