作者:微軟全球資深副總裁、微軟AI亞太總裁 張祺
今天,我們正式推出 Office Agent —— 一個基于開源技術棧、Anthropic Claude 模型,并采用全新的“TDD-品味驅動開發(fā)(Taste-Driven Development)”范式構建的多智能體系統(tǒng)。Office Agent 的目標是幫助用戶快速生成高質量內容:精致的 PowerPoint 演示文稿、可直接使用的 Word 文檔,和即將推出的動態(tài) Excel 表格。
Office Agent經(jīng)由多個專用智能體的協(xié)同,實現(xiàn)了從規(guī)劃、撰寫到完善的全流程自動化,全面提升了Office內容生產(chǎn)效率。該系統(tǒng)基于通用型智能體架構,已通過行業(yè)領先基準測試GAIA認證,性能領先,在處理復雜工作流時兼具可靠性與精細度。
▲ GAIA 報告結果
AI 服務商 公布的官方指標
Manus:2025 年 3 月 10 日;Genspark:2025 年 4 月 25 日;OpenAI DR:2025 年 2 月 2 日。
說明:L1、L2 和 L3 分別表示難度遞增的測試查詢,從“最簡單”到“最困難”。
01 架構設計
基于開源的多智能體系統(tǒng)編排
在核心架構中,Agent 由多智能體編排引擎驅動:
中央規(guī)劃智能體:負責協(xié)調任務并整合結果
專用智能體(涵蓋代碼、金融、搜索等領域):并行執(zhí)行各自任務
安全工具層:集成多種實用工具并提供沙盒環(huán)境
基于開源框架和社區(qū)創(chuàng)新,Office Agent 實現(xiàn)了高效協(xié)同的智能體工作流,兼具日常任務所需的性能與可靠性。
02 TDD - 品味驅動開發(fā)(Taste-Driven Development) 新范式
先立審美之本,后行技藝之工
大多數(shù) AI 智能體生成演示文稿時,僅僅輸出原始代碼,導致生成的文檔版式不均、視覺元素雜亂,用戶不得不進行多輪手動修正。Office Agent致力于打造精致、專業(yè)的內容,為用戶提供更高的價值。
首先,Office Agent 引入了一種全新的創(chuàng)作方法——品味驅動開發(fā)(TDD),即以品味為導向的開發(fā)理念:
可復用的“品味設計范式”:源自高質量、長期積累的內部內容;
統(tǒng)一的設計語言:確保演示文稿整體風格一致;
即用且美觀的輸出:兼顧實用性與審美。
借助TDD,Agent在AI生成內容的美學布局上達到了更高標準——以演示文稿生成為例,基于TDD框架,優(yōu)雅的PPT生成以“品味提煉”為起點:團隊分析了海量高質量演示文稿樣本,提取其中的核心品味設計藍圖。這些提煉出的先驗知識被注入智能體的規(guī)劃與執(zhí)行環(huán)節(jié),并直接影響其生成的版式、風格與內容。
其次,工作流采用迭代循環(huán)。
每則生成內容均須通過“內容自驗證模塊”進行審校,評估質量與美感。審校反饋會回傳給智能體,驅動其自我迭代與優(yōu)化。最終產(chǎn)出為一組 HTML5 幻燈片,既突出設計的張力,又兼顧結構的規(guī)范。為最大化提升生成內容的可用性,團隊提供了轉換工具,可將HTML5自動轉換為PowerPoint格式,以便用戶在Microsoft PowerPoint中進一步編輯。
Office Agent 的流程與輸出示例:
提示詞:“我將進行一場關于神經(jīng)網(wǎng)絡的講座——能幫我制作教學幻燈片嗎?”
未來工作趨勢
提示詞:“創(chuàng)建一份演示文稿,總結塑造未來工作的全球五大趨勢(如 AI 采用、遠程辦公、基于技能的招聘)。請包含 Microsoft WorkLab 的數(shù)據(jù)作為參考來源?!?/p>
咖啡文化演變
提示詞:“制作展示咖啡文化演變的幻燈片?!?/p>
供應鏈韌性轉型
提示詞:“展示全球企業(yè)供應鏈戰(zhàn)略從‘效率優(yōu)先’向‘韌性優(yōu)先’的轉變。以雅致的世界地圖、時間軸圖形展示變遷,用精煉的襯線標題和柔和背景烘托整體格調?!?/p>
其三,自動主題:高質量輸出的新方式。
長期以來,制作演示文稿時,預設主題都是許多用戶的默認選擇。長期以來,用戶制作演示文稿時往往依賴預設主題。預設主題提供了多樣性,支持用戶個性化表達,卻往往犧牲了與用戶需求及喜好精準匹配的可能性。傳統(tǒng)的假設是,選項越多越好,只要提供足夠多的模板,用戶總能從諸多選項中找到較為合適的。然而,這未必是最佳的設定。用戶或許并不想在無盡的設計中遴選——他們需要的是能夠恰到好處展現(xiàn)其思想與創(chuàng)意的設計。
這正是我們設計自動主題(auto theming)的原因。它并不是讓用戶在一長串預設模板中挑選,而是直接讀取內容本身,并生成與之自然契合的設計。結果不只是“又一個主題”,而是“真正合適的主題”。
示例
其四,專家引導的“風格規(guī)則“
TDD 固然提升了質量底線,但系統(tǒng)的核心依舊承載著人的判斷。在開發(fā)過程中,設計師通過審視和打磨示例案例、精選最具代表性的模式,塑造了系統(tǒng)的“審美品味”。這些設計洞察被提煉成風格規(guī)則,由智能體在運行時應用,從而保證生成結果既呼應核心指令,又能規(guī)模化輸出精致的內容。
其五,TDDEval——“品味驅動生成”的基準測試。
為了評估 TDD 在 PowerPoint、Excel 和 Word 中的表現(xiàn),團隊開發(fā)了 TDDEval 基準測試。與通用型基準不同,TDDEval確保了知識型工作的廣度,涵蓋多種測試任務。該基準包括高價值、具有代表性的場景,例如:
創(chuàng)建商業(yè)計劃書 PPT;
在 Excel 中生成預算預測;
撰寫正式的 Word 報告。
同時,它還包含邊界場景的測試,從開放性提示到精確分析請求,確保系統(tǒng)具備足夠的穩(wěn)健性。
質量評估采用雙重視角框架:
內容質量:評估輸出在事實與結構上的完整性,包括:
(a) 是否基于源材料
(b) 主題相關性
(c) 覆蓋完整性
(d) 邏輯結構
(e) 實用性
品味評分:衡量美學與體驗維度,包括:
(a) 視覺吸引力
(b) 布局與組織
(c) 字體排版質量
(d) 設計一致性
(e) 視覺素材的精選度
結合這兩個維度,可以全面評估輸出是否既正確又具備專業(yè)外觀與即用體驗。通過同時量化“內容”和“風格”,TDDEval為AI生成的生產(chǎn)力內容設定了更高的質量標準。
03 經(jīng)驗總結
通過打造和測試 Office Agent,我們積累了許多經(jīng)驗,這些經(jīng)驗直接影響了系統(tǒng)的設計與表現(xiàn)。它們并揭示了在真實生產(chǎn)力場景中,讓智能體系統(tǒng)做到可靠、精準、實用所需的關鍵要素。
經(jīng)驗 1:何時應優(yōu)先采用通用代碼執(zhí)行,而非任務專用工具
雖然任務專用工具在可預測、可重復的場景中表現(xiàn)良好,但通用型智能體需要具備靈活性,并能在多樣化的工具調用中實現(xiàn)泛化。為打造高質量的通用智能體,Office Agent 采用“code-first”的方法,即允許模型編寫并執(zhí)行代碼(如MP3轉寫、PDF 文本提取),而不是依賴任務專用工具——雖然專用工具更可控、更穩(wěn)定,但它們會限制靈活性,影響智能體的泛化能力。
這種設計讓智能體更像一名全棧開發(fā)者,而不是只會解決單一任務的“專才”。
經(jīng)驗 2:自我驗證提升準確性率
對于復雜或多步驟任務,智能體需要定期驗證進度并自我評估,以提高準確率:
鼓勵模型重述原始問題,并與當前輸出進行比對,確保一致性。
插入中間檢查點,提升可靠性,尤其適用于需要精確度、篩選或多源信息整合的任務。
人機協(xié)作:用戶可要求 Office Agent 審查執(zhí)行結果或生成內容,確認是否符合預期,并提出進一步調整。
經(jīng)驗 3:模擬人類瀏覽,而非僅抓取內容
瀏覽器工具應支持類人化的網(wǎng)頁導航,而不僅僅是頁面抓取:
智能體不僅要提取原始頁面內容,還應具備類人瀏覽能力。
讓模型執(zhí)行以下操作:
點擊鏈接、翻頁、滾動長頁面;
將每次瀏覽視為持續(xù)的信息收集過程。
將所有中間觀察納入上下文,提升推理能力。
利用基于大語言模型的摘要技術高效壓縮長篇內容,在保留關鍵信息的同時優(yōu)化上下文記憶。
經(jīng)驗 4:注入偏好知識,提升任務執(zhí)行質量
雖然LLM擁有廣泛的世界知識,但在沒有明確引導時,往往難以形成對任務的特定偏好。通過注入先驗知識或偏好(如“處理.docx文件時使用python-docx”),可以幫助智能體更快選擇最佳執(zhí)行路徑,從而提高一致性和工具選擇的合理性。這種引導還能減少幻覺,確保決策基于可靠、經(jīng)過驗證的模式。
04 未來之路
目前,Office Agent 已通過 Frontier 計劃向 Microsoft 全球版?zhèn)€人和家庭訂閱用戶開放,面向商業(yè)用戶的支持也即將到來。Office Agent是一款“從0到1”的人機協(xié)同創(chuàng)作工具,能夠從無到有生成高質量、基于研究的內容;而PowerPoint、Word和Excel中的Copilot則繼續(xù)作為應用內專家,幫助用戶在不同應用中進行優(yōu)化、編輯和迭代。兩者結合,能夠無縫融入用戶的工作流程。
這僅僅是一個開始。我們團隊正在推進智能體的編排能力,豐富審美風格庫,并將進一步擴展其在微軟生態(tài)系統(tǒng)中的集成。Office Agent智能體系統(tǒng)不僅僅是任務助手,更將重塑知識型工作的創(chuàng)作、打磨與規(guī)?;瓿煞绞?。
-
微軟
+關注
關注
4文章
6704瀏覽量
106944 -
模型
+關注
關注
1文章
3609瀏覽量
51418 -
Agent
+關注
關注
0文章
154瀏覽量
28371
原文標題:Office Agent —— 打造“品味驅動”的多智能體系統(tǒng),全面增強 Microsoft 365 Copilot
文章出處:【微信號:mstech2014,微信公眾號:微軟科技】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
評論