chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

模型原生操作系統(tǒng):機遇、挑戰(zhàn)與展望 CCCF精選

OpenHarmony TSC ? 來源:OpenHarmony TSC ? 作者:OpenHarmony TSC ? 2025-03-14 17:46 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本文立足人工智能時代用戶、應(yīng)用和系統(tǒng)的需求,分析“外掛式模型”演進路徑下的操作系統(tǒng)發(fā)展困局,提出通過“模型-系統(tǒng)-芯片”的全棧協(xié)同設(shè)計來構(gòu)建模型原生操作系統(tǒng),并進一步探討了面臨的機遇與挑戰(zhàn),以及業(yè)界與作者團隊的相關(guān)初步探索。

wKgZO2fT-8mAOUpTAAC-Z-xLPOs337.png

以ChatGPT為代表的生成式人工智能(Generative AI)正在深刻變革人類社會。大模型憑借其卓越的語言理解、內(nèi)容生成與邏輯推理能力,已成為科技發(fā)展的新范式與重要推動力。全球主要經(jīng)濟體和科技巨頭紛紛布局,美國和歐盟累計投資上千億美元推進技術(shù)研發(fā),微軟、英偉達、蘋果、谷歌等公司在模型架構(gòu)、系統(tǒng)、芯片等方面展開全方位競爭。

然而,操作系統(tǒng)作為計算機系統(tǒng)的核心樞紐,其與人工智能技術(shù)的融合仍面臨諸多挑戰(zhàn)。當前主流方案如微軟的Windows Copilot和蘋果的Apple Intelligence機制,采用將模型作為外掛服務(wù)的方式。這種方案雖然能快速落地,但模型的概率性特征、軟硬件棧的復(fù)雜性,以及模型-系統(tǒng)-芯片的割裂狀態(tài)等結(jié)構(gòu)性問題,導致當前基于模型的智能應(yīng)用存在可控性差、開發(fā)難度大、算力效能低等短板,領(lǐng)域生態(tài)面臨“重作詩、輕做事”、生態(tài)碎片化、智能水平受限等問題。

本文立足人工智能時代用戶、應(yīng)用和系統(tǒng)的需求,分析“外掛式”AI演進路徑下的操作系統(tǒng)發(fā)展困局,提出通過“模型-系統(tǒng)-芯片”的全棧協(xié)同設(shè)計來構(gòu)建模型原生操作系統(tǒng)。這一新型操作系統(tǒng)將重構(gòu)交互范式、接口抽象、執(zhí)行模式、安全機制等,打通智能應(yīng)用間的數(shù)據(jù)壁壘,促進多模型有機協(xié)同,優(yōu)化資源供給以提升運行效能,最終實現(xiàn)模型的概率性智能與操作系統(tǒng)的確定性規(guī)則的有機統(tǒng)一。本文將探討模型原生操作系統(tǒng)面臨的機遇與挑戰(zhàn),并介紹業(yè)界與作者團隊的相關(guān)初步探索。

人工智能時代操作系統(tǒng)的需求與挑戰(zhàn)

算法、數(shù)據(jù)、算力被譽為人工智能發(fā)展的三大引擎。操作系統(tǒng)的泛在性是連接和驅(qū)動這三大引擎的關(guān)鍵紐帶,是人工智能邁向通用智能、賦能千行百業(yè)的重要基石。從操作系統(tǒng)的視角來看,包括大模型、小模型、傳統(tǒng)機器學習方法等在內(nèi)的“模型”正在演變?yōu)橐环N底層基礎(chǔ)能力。人工智能時代的操作系統(tǒng)亟須實現(xiàn)對模型的原生支持,以滿足來自用戶、應(yīng)用及系統(tǒng)自身的智能化需求,在執(zhí)行效能、智力水平、交互范式、隱私保護與系統(tǒng)安全等方面實現(xiàn)變革。

執(zhí)行效能

隨著生成式人工智能的發(fā)展,模型參數(shù)規(guī)模呈指數(shù)級增長,對算力的需求也急劇攀升。為提供更強的算力支撐,GPU、NPU等新型算力硬件組成的異構(gòu)、混合精度算力系統(tǒng)已成為當前人工智能場景的基礎(chǔ)設(shè)施,主流芯片設(shè)計廠商紛紛推出異構(gòu)算力芯片。異構(gòu)算力也促使虛擬數(shù)字人等新興應(yīng)用場景出現(xiàn),該應(yīng)用往往需要GPU/NPU/CPU等多種計算硬件協(xié)同工作以支持虛擬數(shù)字人的實時交互和智能表現(xiàn)。在這一趨勢下,操作系統(tǒng)需要管理的資源從傳統(tǒng)的離散垂域分治轉(zhuǎn)向異構(gòu)融合架構(gòu),這帶來了雙重挑戰(zhàn):(1)異構(gòu)算力的融合使編程模型與框架日趨復(fù)雜,迫切需要操作系統(tǒng)向應(yīng)用提供統(tǒng)一、易用的編程抽象,以降低開發(fā)門檻;(2)不同硬件具有獨特的性能特質(zhì)和適用場景,如GPU、NPU適合大批量數(shù)據(jù)的高吞吐計算,CPU則更適合小規(guī)模數(shù)據(jù)的低延遲處理,這要求操作系統(tǒng)能夠智能規(guī)劃任務(wù)分配,實現(xiàn)異構(gòu)硬件的協(xié)同調(diào)度,最終提升系統(tǒng)整體執(zhí)行效能。

智力水平

大模型的迅猛發(fā)展正在重塑智能終端設(shè)備形態(tài),有望賦能百億級參數(shù)的智能設(shè)備。全球領(lǐng)先的智能手機、個人電腦(PC)和汽車制造商正積極探索將大模型部署至移動設(shè)備和車載芯片上,以獲得更好的隱私保護和發(fā)揮本地化優(yōu)勢。谷歌推出的AI Core可在智能手機上運行擁有20億參數(shù)的Gemini Nano模型,蘋果計劃在iOS 18中整合30億參數(shù)的本地大模型,華為也通過鴻蒙原生智能將AI能力下沉到終端。面對這一趨勢,操作系統(tǒng)必須突破創(chuàng)新,使規(guī)模更大、智能水平更高的模型能夠在終端設(shè)備上高效運行。然而,現(xiàn)有的模型壓縮方法如量化、裁剪等往往導致模型性能顯著下降。這一技術(shù)瓶頸要求操作系統(tǒng)深入理解模型特性,探索更有針對性的優(yōu)化方案,而不能僅依靠簡單的壓縮、量化等手段。

交互范式

大模型正在引領(lǐng)人機交互范式的革命性轉(zhuǎn)變,將用戶從傳統(tǒng)的圖形界面演進為語音、手勢、眼神等自然時空交互。很多行業(yè)正在積極探索這一新型交互形態(tài),例如,OpenAI的GPT-4o支持實時語音對話,可充當智能家教輔導作業(yè);智譜AI的AutoGLM能夠理解并執(zhí)行復(fù)雜甚至跨APP的指令,包括“在線購物”“酒店預(yù)訂”甚至“發(fā)送紅包”等??梢灶A(yù)見,隨著數(shù)字化與智能化的深入,大模型將成為人機交互的重要入口,甚至能夠根據(jù)用戶習慣和場景動態(tài)調(diào)整交互界面。然而,當前模型在理解用戶界面方面仍面臨諸多挑戰(zhàn)。例如,界面元素往往具有多樣的分辨率、比例和布局,并包含大量細粒度的文本、按鈕等交互對象,這些特點使現(xiàn)有模型難以準確理解界面語義,制約了自然語言交互的效果。

隱私保護與系統(tǒng)安全

隨著大模型應(yīng)用的普及,其安全與隱私問題日益突出。近期歐洲數(shù)據(jù)保護委員會(EDPB)和意大利隱私監(jiān)管機構(gòu)對OpenAI服務(wù)進行了嚴格審查,意大利甚至一度叫停ChatGPT。大模型的隱私保護涉及多個層面:(1)在數(shù)據(jù)層面,模型在訓練和推理過程中可能泄露敏感信息,同時模型參數(shù)本身也是重要的數(shù)字資產(chǎn);(2)在系統(tǒng)層面,復(fù)雜的軟硬件棧難免存在安全漏洞;(3)在行為層面,模型輸出的不確定性可能導致越權(quán)操作或偏離預(yù)期;(4)當前系統(tǒng)過度關(guān)注性能指標,缺乏系統(tǒng)化的行為審計與約束機制。這要求我們構(gòu)建多維度的安全防護體系,在數(shù)據(jù)、系統(tǒng)、行為、審計等層面實現(xiàn)全方位的隱私保護。

當前“外掛式”AI演進路徑的發(fā)展困局

以微軟Windows Copilot為代表的AI發(fā)展路徑以“外掛”形式在操作系統(tǒng)中提供智能化服務(wù)。Windows 11操作系統(tǒng)內(nèi)置了專門的Copilot窗口,支持用戶通過任務(wù)欄圖標、快捷鍵或?qū)S冒存I等多種方式快速調(diào)用AI助手。Copilot不僅能夠進行文本對話,還能執(zhí)行調(diào)整系統(tǒng)設(shè)置、輔助日常操作、給出寫作建議等多樣化任務(wù)。然而,這種將AI作為外掛式服務(wù)集成到現(xiàn)有操作系統(tǒng)的方案,雖然能夠快速落地并讓用戶體驗到智能服務(wù),但從長遠來看,存在算力差、智力差、魅力差、安全差四個方面的根本性困局,阻礙人工智能技術(shù)與操作系統(tǒng)的深度融合,影響為用戶提供更高水平的智能服務(wù)。

算力差:無法充分利用異構(gòu)硬件的計算能力

當前算力硬件呈現(xiàn)快速迭代和多元化發(fā)展趨勢。一方面,主流GPU硬件不斷升級迭代;另一方面,各類AI芯片在提供特定算力優(yōu)化的同時,也在能耗、性價比等方面給予了更多選擇。智能手機、AI PC等端側(cè)場景更是普遍采用混合算力架構(gòu),追求提升絕對計算能力的同時降低整體功耗。但在端側(cè)部署大模型時,其參數(shù)規(guī)模當前停留在70億左右,大大限制了系統(tǒng)的智能水平。隨著智能化應(yīng)用的普及,算力硬件資源不再被少數(shù)應(yīng)用獨享,亟須操作系統(tǒng)對異構(gòu)化算力進行統(tǒng)一、高效、協(xié)同的調(diào)度和管理,進而將硬件的絕對計算能力兌現(xiàn)成應(yīng)用和系統(tǒng)的智力。外掛式智能服務(wù)面臨的困局在于,缺少操作系統(tǒng)的原生支持,無法有效利用和管理混合、異構(gòu)化算力資源,甚至可能造成算力資源的競爭與沖突。

智力差:智能化技術(shù)難以與操作系統(tǒng)深度融合

以外掛方式集成智能技術(shù),僅能提供單向、有限的智能化支持,難以與操作系統(tǒng)各模塊深度融合,導致智能技術(shù)難以滲透到操作系統(tǒng)的關(guān)鍵服務(wù)和功能,限制了系統(tǒng)的智能化水平,阻礙其從“作詩”走向“做事”。外掛式智能技術(shù)難以利用操作系統(tǒng)的底層數(shù)據(jù)和資源,大大限制了其智力水平。例如,Windows Copilot無法直接訪問系統(tǒng)深層數(shù)據(jù),未能與系統(tǒng)深度融合,且已被降級為漸進式網(wǎng)絡(luò)應(yīng)用程序(PWA)。此外,外掛式智能技術(shù)存在數(shù)據(jù)孤島、響應(yīng)延遲高等問題,模型的概率性問題進一步突顯,導致資源分配、任務(wù)調(diào)度及內(nèi)存管理等系統(tǒng)服務(wù)的智能化受到極大限制,難以實現(xiàn)深度系統(tǒng)級優(yōu)化。

魅力差:未能突破傳統(tǒng)操作系統(tǒng)固化的交互模式

傳統(tǒng)操作系統(tǒng)固化的交互邏輯難以滿足用戶群體的不同偏好,以及在不同場景下的交互需求。一方面,現(xiàn)有交互邏輯仍然是由開發(fā)者靜態(tài)設(shè)計,所有用戶體驗一份相同的交互邏輯,無法提供“千人千面”的個性化用戶體驗。另一方面,不同應(yīng)用的交互邏輯完全獨立,即便一個簡單的用戶任務(wù)也會涉及多個應(yīng)用,導致用戶必須在應(yīng)用之間反復(fù)切換。傳統(tǒng)操作系統(tǒng)固化的交互模式大大限制了智能技術(shù)融入人機交互過程。以蘋果公司Ferret-UI為例,其雖能利用多模態(tài)大模型操控用戶界面(UI)屏幕完成任務(wù),但受限于固化交互模式,仍然被迫在多個應(yīng)用間頻繁切換與操作,單次任務(wù)包含冗長的操作與決策鏈條,導致任務(wù)完成率低、完成時間長、推理費用高等問題。

安全差:易導致系統(tǒng)安全隱患和隱私泄露問題

當前智能技術(shù)本身存在不可解釋、不確定等安全隱患,而智能服務(wù)的執(zhí)行模式、交互方式等仍處于快速迭代發(fā)展中,其安全可靠性遠低于操作系統(tǒng)。近年來,使用ChatGPT引發(fā)的機密泄露事件頻發(fā),反映出大模型和智能服務(wù)面臨安全挑戰(zhàn)。以外掛形式集成智能服務(wù),未將其納入到整個系統(tǒng)的安全保護機制中,可能引入安全漏洞并放大操作系統(tǒng)攻擊面,勢必影響系統(tǒng)的安全穩(wěn)定。如果允許外掛式智能服務(wù)直接訪問系統(tǒng)和處理數(shù)據(jù),容易被利用成為攻擊入口和跳板。而如果單純將其隔離在外,智能服務(wù)使用的用戶數(shù)據(jù)又會面臨隱私泄露風險。

上述困局本質(zhì)上源于外掛式智能服務(wù)方案未能實現(xiàn)AI與操作系統(tǒng)的有機融合,最終限制了整體的智能化水平。要真正發(fā)揮AI的潛力,需要在操作系統(tǒng)架構(gòu)層面進行更深層次的變革。

破局思考:模型原生操作系統(tǒng)

模型作為一種底層基礎(chǔ)能力,在人工智能時代的操作系統(tǒng)演進中必然扮演著重要角色,但操作系統(tǒng)以何種路徑與模型融合是一個重要且開放的問題。圖1對比了不同的發(fā)展路徑。圖1(a)為漸進路線,即采用前文所提的將大模型作為應(yīng)用外掛到現(xiàn)有操作系統(tǒng)的方法,優(yōu)點是對現(xiàn)有操作系統(tǒng)改動少,可快速落地;缺點在于割裂模型與操作系統(tǒng),制約了模型的能力。圖1(b)為激進路線,即用大模型一次性取代操作系統(tǒng)成為新的操作系統(tǒng),優(yōu)點在于可充分發(fā)揮大模型的智能能力;缺點在于完全顛覆現(xiàn)有軟件格局與生態(tài),過于依賴模型本身的能力,缺乏與物理世界的交互能力,也缺乏對輸出的確定性保證。

wKgZO2fT-8qAH-e6AANJXrmuPAk848.png

圖1 智能時代操作系統(tǒng)與模型融合的不同發(fā)展路徑的系統(tǒng)架構(gòu)對比

與前兩種技術(shù)路線不同,我們提出采用融合路線探索模型原生操作系統(tǒng),如圖1(c)所示。融合路線基于模型與操作系統(tǒng)雙向奔赴的思路,即系統(tǒng)原生為模型設(shè)計,模型原生為系統(tǒng)調(diào)整,通過在服務(wù)模型操控、供給模型資源、融合模型能力方面進行探索,實現(xiàn)模型與操作系統(tǒng)的多層次深度融合。通過“模型-系統(tǒng)-芯片”全棧協(xié)同設(shè)計,重構(gòu)接口抽象、執(zhí)行模式、運行效能和安全機制等核心要素,實現(xiàn)概率性智能與確定性規(guī)則的有機統(tǒng)一,提升手機、PC、通用機器人、智能制造等領(lǐng)域的系統(tǒng)智能化水平,為用戶提供更加流暢、智能、個性化的服務(wù)。在此,我們將從六個維度闡述對模型原生操作系統(tǒng)的思考。

思考一:智能交互范式(面向交互范式革新)

大模型正在重塑操作系統(tǒng)與用戶的交互方式。傳統(tǒng)操作系統(tǒng)采用直接面向用戶的交互設(shè)計,用戶通過命令行、圖形界面、語音等接口操控硬件。在模型原生時代,用戶將更多地通過與智能體交互實現(xiàn)設(shè)備控制。然而,當前操作系統(tǒng)的交互框架與智能體存在多重不匹配。在接口層面,現(xiàn)有框架主要依賴圖形界面表達功能語義,而大模型在UI理解的準確性和確定性方面仍有明顯短板;在邏輯層面,傳統(tǒng)框架要求開發(fā)者靜態(tài)設(shè)計每個應(yīng)用的交互邏輯,難以支持大模型為用戶提供動態(tài)個性化的交互體驗;在能力層面,應(yīng)用間數(shù)據(jù)與功能的割裂狀態(tài),阻礙了操作系統(tǒng)利用大模型實現(xiàn)跨應(yīng)用的智能服務(wù)。

為應(yīng)對這些挑戰(zhàn),模型原生操作系統(tǒng)需要在多個層面進行協(xié)同創(chuàng)新。在交互接口層面,設(shè)計面向模型的新型操作接口,使模型能夠準確高效地調(diào)用系統(tǒng)功能;在交互邏輯層面,提供支持多模態(tài)的生成式交互邏輯開發(fā)框架,使開發(fā)者能夠利用大模型動態(tài)構(gòu)建時空自然交互;在交互能力層面,構(gòu)建“系統(tǒng)-模型-應(yīng)用”的數(shù)據(jù)互通機制,打通應(yīng)用間壁壘,支持基于上下文的智能交互。

思考二:創(chuàng)新系統(tǒng)抽象接口(面向提高執(zhí)行效能)

隨著模型與操作系統(tǒng)的融合,傳統(tǒng)操作系統(tǒng)的抽象面臨挑戰(zhàn)?,F(xiàn)有接口針對命令式服務(wù)設(shè)計,難以滿足智能體的需求:(1)無法充分表達應(yīng)用語義或?qū)崿F(xiàn)端到端智能優(yōu)化;(2)缺乏原生智能化能力支持,增加了開發(fā)負擔,限制了智能體間的協(xié)作。同時,現(xiàn)有接口難以暴露底層系統(tǒng)服務(wù)和異構(gòu)硬件能力,導致性能損失。

為應(yīng)對這些挑戰(zhàn),操作系統(tǒng)須引入智能化抽象,支持從單一命令到端到端需求的動態(tài)、靈活表達。在系統(tǒng)層面,支持多種層次的系統(tǒng)服務(wù)接口,高層接口滿足傳統(tǒng)應(yīng)用和程序使用,底層接口用于高性能智能應(yīng)用優(yōu)化,充分平衡智能的應(yīng)用和系統(tǒng)的實時性。同時,應(yīng)結(jié)合歷史行為和模型智能,利用生成式接口的新特性實現(xiàn)自我優(yōu)化與智能演進。

思考三:系統(tǒng)內(nèi)生智能(面向提高智力水平)

當前智能體的能力邊界局限于單個應(yīng)用范圍,各應(yīng)用通過外掛模型實現(xiàn)智能化。例如,用戶期望智能體能自動完成日程安排,這需要跨越日歷、會議、郵件等多個應(yīng)用實現(xiàn)協(xié)同。然而,目前面向特定領(lǐng)域的專用模型在適應(yīng)性和魯棒性方面存在明顯不足。典型案例是當前的手機智能助手,雖然能夠執(zhí)行簡單的購物任務(wù),但一旦遇到未經(jīng)訓練的廣告彈窗等干擾就極易中斷操作。

為此,模型原生操作系統(tǒng)應(yīng)具備內(nèi)生智能,從而有機整合來自不同應(yīng)用智能體的能力,實現(xiàn)跨應(yīng)用的無縫配合與復(fù)雜協(xié)同。這就需要構(gòu)建面向操作系統(tǒng)的通用基礎(chǔ)模型,提供系統(tǒng)級智能體服務(wù),并實現(xiàn)模型能力與系統(tǒng)功能的深度融合,支持跨應(yīng)用的無縫協(xié)作;同時,建立高效的持續(xù)學習機制,探索新的操作系統(tǒng)內(nèi)生智能的訓練方法,并實現(xiàn)高效、低成本的持續(xù)訓練和微調(diào),以更好地滿足用戶多樣化的智能需求。

思考四:智能知識存儲(面向提高智力水平)

模型智能水平與知識型數(shù)據(jù)緊密相關(guān),現(xiàn)有存儲系統(tǒng)主要面向數(shù)據(jù)而非知識,難以滿足大模型對知識生成、管理和利用的需求。在縱向維度,現(xiàn)有系統(tǒng)在設(shè)計上強調(diào)對原始數(shù)據(jù)的存取,缺乏對數(shù)據(jù)語義層次和知識表示的高效支持;在橫向維度,模型應(yīng)用模糊化的輸入使多模態(tài)、多類型的存儲系統(tǒng)關(guān)聯(lián)更加緊密,而異構(gòu)表達形式給數(shù)據(jù)跨應(yīng)用橫向流動帶來挑戰(zhàn)。

為應(yīng)對這些挑戰(zhàn),在縱向?qū)用妫到y(tǒng)須面向知識存儲最大程度地利用軟硬協(xié)同的通信機制,提供與硬件演進協(xié)同發(fā)展的編程抽象;在橫向?qū)用?,系統(tǒng)應(yīng)通過更高整合度的數(shù)據(jù)結(jié)構(gòu)與通信機制,實現(xiàn)不同存儲系統(tǒng)數(shù)據(jù)互通與協(xié)作,為模型提供跨應(yīng)用的數(shù)據(jù)融合能力,使多模態(tài)等任務(wù)中的數(shù)據(jù)協(xié)同更加高效,從而提升模型在復(fù)雜場景下的智能水平。

思考五:高效算力供給(面向提高執(zhí)行效能)

模型對算力有著極高的要求。然而,模型原生操作系統(tǒng)在為模型提供算力時,不能僅考慮模型本身的需求,還要綜合考慮算力、內(nèi)存、功耗、智能水平等多個相互制衡的關(guān)鍵指標。當前異構(gòu)算力硬件體系為智能應(yīng)用提供了關(guān)鍵性的算力支撐,但當前操作系統(tǒng)仍然以特殊外設(shè)的方式管理算力硬件,智能應(yīng)用主要依賴專門化適配與設(shè)計來利用特定的算力硬件,導致系統(tǒng)嚴重碎片化,也大大限制了智能應(yīng)用的發(fā)展和普及。

為應(yīng)對這些挑戰(zhàn),需要在多個層面實施優(yōu)化策略。在模型層面,研究如何在保持模型性能的同時減少參數(shù)量;探索動態(tài)調(diào)整模型結(jié)構(gòu)的方法,并針對智能體等復(fù)雜場景提出針對性的模型微調(diào)和輕量化設(shè)計。在系統(tǒng)層面,探索端側(cè)資源受限場景下的高效推理方案,包括面向操作系統(tǒng)目標任務(wù)的模型稀疏化、投機推理等;同時設(shè)計新的計算卸載方案,在保證用戶數(shù)據(jù)隱私以及對應(yīng)用盡可能透明的前提下,充分利用來自富算力設(shè)備的計算資源。在硬件層面,探索異構(gòu)計算架構(gòu),針對不同類型任務(wù)提供專用處理單元并實現(xiàn)協(xié)同調(diào)度和統(tǒng)一管理,提高整體效率。

思考六:系統(tǒng)安全可靠(面向隱私保護與系統(tǒng)安全)

隨著大模型系統(tǒng)應(yīng)用越來越廣泛,其在隱私安全與可靠性方面的挑戰(zhàn)也越來越突出。在數(shù)據(jù)隱私方面,一方面大模型在訪問和生成數(shù)據(jù)時,可能會泄露隱私數(shù)據(jù)和敏感信息;另一方面,大模型自身的參數(shù)也是需要保護的重要數(shù)字資產(chǎn)。在可靠性層面,大模型的輸出存在不確定性,可能導致模型執(zhí)行未經(jīng)授權(quán)的操作或出現(xiàn)偏離預(yù)期的行為;目前的系統(tǒng)往往注重性能和精度等指標的提升,缺乏有效的行為審計機制和約束技術(shù)。

為應(yīng)對這些挑戰(zhàn),在數(shù)據(jù)安全方面,應(yīng)對大模型的參數(shù)和數(shù)據(jù)進行“存儲-傳輸-計算”的全生命周期加密保護,嚴格控制數(shù)據(jù)流轉(zhuǎn)時的訪問權(quán)限,并構(gòu)建輕量化、定制化的可信AI軟件棧,減少攻擊面以提高系統(tǒng)的整體安全性;在可靠性方面,提出面向智能應(yīng)用安全的內(nèi)生安全審計機制,通過彈性規(guī)則對模型的行為進行動態(tài)約束,在保證模型智能水平的同時有效提升確定性。

當前探索與實踐

模型原生操作系統(tǒng)作為一種新興的技術(shù)范式,正在成為人工智能大模型從“作詩”走向“做事”的關(guān)鍵。雖然目前尚未出現(xiàn)完全實現(xiàn)這一設(shè)計理念的成熟產(chǎn)品,但國內(nèi)外學術(shù)界和工業(yè)界已經(jīng)開展了這方面的初步探索。

OpenAI聯(lián)合創(chuàng)始人安德烈·卡帕西(Andrej Karpathy)在2023年11月提出了LLM OS理念,激進地用大語言模型替代操作系統(tǒng)(LLM as OS)。美國羅格斯大學提出的AIOS是LLM OS理念的一次初步實踐。然而,這類探索主要存在兩個局限:一是提出了全新的交互范式和軟件開發(fā)模式,難以有效兼容現(xiàn)有軟件生態(tài);二是將模型作為黑盒使用,并未針對模型的推理效能、智力水平等進行針對性地優(yōu)化。作為一種折衷方案,SWE-agent提出了智能體-計算機接口(Agent-Computer Interface, ACI),將大模型智能體在軟件工程任務(wù)中能夠解決的問題從3.8%提升至18%,驗證了操作系統(tǒng)與大模型協(xié)同的重要性。

除了系統(tǒng)架構(gòu)和編程接口層面的創(chuàng)新,工業(yè)界正在積極探索操作系統(tǒng)智能體技術(shù)。美國Anthropic公司的Computer Use和國內(nèi)智譜公司的AutoGLM等系統(tǒng)通過將云端大模型與圖形界面(GUI)深度融合,實現(xiàn)了智能化的界面操作自動化,在辦公應(yīng)用、社交媒體、在線購物等場景展現(xiàn)出接近人類水平的操作能力。然而,當前基于外掛式多模態(tài)大模型的方案在處理動態(tài)UI和復(fù)雜操作時仍面臨挑戰(zhàn)。同時,依賴云端大模型帶來的網(wǎng)絡(luò)延遲和隱私安全問題也亟待解決。

為了支持大模型在端側(cè)設(shè)備中的推理,當前業(yè)界提出了多種端側(cè)大模型推理框架,如ExecuTorch、llama.cpp和MLC LLM等,然而這些系統(tǒng)對異構(gòu)算力的利用有限,端側(cè)設(shè)備通常只能運行不超過100億參數(shù)的小型模型,制約了模型原生操作系統(tǒng)的性能水平。為解決這一問題,上海交通大學推出PowerInfer系列工作,首次探索“模型-系統(tǒng)-芯片”協(xié)同設(shè)計理念,實現(xiàn)端側(cè)大模型的顯著加速。該方案在模型層面采用Turbo Sparse方法提升模型稀疏性,在系統(tǒng)和芯片層面優(yōu)化操作系統(tǒng)推理設(shè)計,實現(xiàn)異構(gòu)算力調(diào)度、神經(jīng)元簇流水線等技術(shù)。實驗結(jié)果表明,PowerInfer-1在個人電腦上實現(xiàn)11.7倍加速,可運行1750億參數(shù)模型;PowerInfer-2讓智能手機流暢運行470億參數(shù)模型,性能提升27.8倍。

模型原生操作系統(tǒng)除了需要解決端側(cè)推理性能問題,還需要解決智能應(yīng)用在硬件加速器層面的高效調(diào)度問題。當前商用GPU缺乏有效的搶占式調(diào)度機制,實時任務(wù)面臨兩難選擇:要么獨占GPU資源,增加成本;要么等待低優(yōu)先級任務(wù)完成,影響性能。上海交通大學團隊最早在商用GPU上實現(xiàn)了百微秒內(nèi)的任務(wù)搶占和細粒度的空分算力共享,與將GPU專用于實時任務(wù)相比,整體吞吐能力提升7.7倍,與多任務(wù)共享GPU相比,時延干擾減少99%。當前硬件加速器百家爭鳴,系統(tǒng)層面的支持成為競爭關(guān)鍵,團隊進一步提出了硬件加速器調(diào)度的通用抽象和多層硬件模型,能夠快速支持不同架構(gòu)、品牌、代次硬件加速器的搶占式調(diào)度,以及開發(fā)硬件無關(guān)的通用調(diào)度策略。

結(jié)束語

模型原生操作系統(tǒng)是人工智能時代操作系統(tǒng)的重要發(fā)展方向,需要在模型與系統(tǒng)的深度融合中探索理論創(chuàng)新。這種融合不是簡單的功能疊加,而是要從架構(gòu)到實現(xiàn)進行全方位創(chuàng)新,從而推動操作系統(tǒng)的智能化演進。雖然學術(shù)界和產(chǎn)業(yè)界在架構(gòu)設(shè)計、性能優(yōu)化、調(diào)度機制等方面取得了一系列初步探索,但要實現(xiàn)真正可用的產(chǎn)品級系統(tǒng),仍須在交互范式革新、模型推理效能、系統(tǒng)融合程度、生態(tài)演進策略等方面持續(xù)深入研究。

(本文內(nèi)容是基于2024中國計算機大會(CNCC2024)“大模型基礎(chǔ)軟件”論壇上的報告《模型原生操作系統(tǒng)的一些思考》進行的擴展)

wKgZO2fT-8qAHpq7AAADrkErmTA829.png

掃碼觀看相關(guān)視頻

wKgZO2fT-8qAJMTdAAAnu5sA3f4332.jpg

陳海波

CCF會士、系統(tǒng)軟件專委會副主任、開源發(fā)展委員會常務(wù)委員。上海交通大學特聘教授,ACM/IEEE Fellow。主要研究方向為操作系統(tǒng)、分布式系統(tǒng)和機器學習系統(tǒng)等。haibochen@sjtu.edu.cn

wKgZO2fT-8qANOoQAAAr8KldzCU463.jpg

夏虞斌

CCF杰出會員、系統(tǒng)軟件專委會常務(wù)委員、開源發(fā)展委員會執(zhí)行委員、教育工委主任助理。上海交通大學教授。主要研究方向為操作系統(tǒng)、體系結(jié)構(gòu)等。xiayubin@sjtu.edu.cn

wKgZO2fT-8qANTs9AAAvP3ejQ_g259.jpg

陳榕

CCF杰出會員、CCCF專欄編委。上海交通大學教授。主要研究方向為操作系統(tǒng)、分布式系統(tǒng)、智能計算系統(tǒng)等。rongchen@sjtu.edu.cn

其他作者:王肇國 糜澤羽 古金宇

CCF推薦

【精品文章】

泛在操作系統(tǒng):研究與實踐 | CCCF精選

分布式系統(tǒng)與可信計算的探索之路——專訪“CCF 海外科技人物獎”獲得者徐潔 | CCCF精選

梅宏:擁抱泛在計算 | CCCF精選

wKgZO2fT-8qAbTdqAACmqtKsn4A804.jpg

wKgZO2fT-8qAeqzZAAC7x5sChNA731.jpg 審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 操作系統(tǒng)
    +關(guān)注

    關(guān)注

    37

    文章

    7325

    瀏覽量

    128563
  • 人工智能
    +關(guān)注

    關(guān)注

    1813

    文章

    49706

    瀏覽量

    261174
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3644

    瀏覽量

    51683
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    龍蜥操作系統(tǒng)裝機量突破1000萬

    11月17日,以“生態(tài)共融·智驅(qū)未來”為主題的2025龍蜥操作系統(tǒng)大會(OpenAnolis Conference)在北京成功舉辦。千余位全球技術(shù)大咖、業(yè)界精英和行業(yè)開發(fā)者齊聚一堂,深入探討AI時代下操作系統(tǒng)產(chǎn)業(yè)發(fā)展的新趨勢、新挑戰(zhàn)
    的頭像 發(fā)表于 11-20 11:40 ?465次閱讀

    單片機的操作系統(tǒng)

    單片機操作系統(tǒng)主要分為實時操作系統(tǒng)(RTOS)和嵌入式操作系統(tǒng)兩類,以下是常見選擇: 實時操作系統(tǒng)(RTOS) ? FreeRTOS ?:輕量級開源內(nèi)核(最小內(nèi)核約6 KB RAM)
    發(fā)表于 11-14 06:18

    樹莓派操作系統(tǒng):版本、特性及設(shè)置完整指南!

    樹莓派操作系統(tǒng)是什么?樹莓派操作系統(tǒng)是由樹莓派基金會專為樹莓派開發(fā)的官方操作系統(tǒng)。它基于DebianLinux發(fā)行版,并針對樹莓派的ARM架構(gòu)進行了專門優(yōu)化。樹莓派操作系統(tǒng)有多個版本,
    的頭像 發(fā)表于 07-28 18:26 ?800次閱讀
    樹莓派<b class='flag-5'>操作系統(tǒng)</b>:版本、特性及設(shè)置完整指南!

    鴻道Intewell操作系統(tǒng):人形機器人底層操作系統(tǒng)

    操作系統(tǒng)的實時性賦能東土科技的鴻道(Intewell)工業(yè)操作系統(tǒng)作為國內(nèi)唯一通過汽車、工業(yè)控制、醫(yī)療、軌道交通四項功能安全認證的系統(tǒng),為標準體系中的技術(shù)層架構(gòu)提供了底層支持。其微內(nèi)核虛擬化架構(gòu)可將人形機器人電子架構(gòu)成本降低50
    的頭像 發(fā)表于 05-16 14:44 ?534次閱讀

    KaihongOS操作系統(tǒng)FA模型與Stage模型介紹

    FA模型與Stage模型介紹 KaihongOS操作系統(tǒng)中,F(xiàn)A模型(Feature Ability)和Stage模型是兩種不同的應(yīng)用
    發(fā)表于 04-24 07:27

    中國汽車報:睿賽德攜“程翧整車基礎(chǔ)軟件OS”亮相操作系統(tǒng)年會

    領(lǐng)域?qū)<遥瑖@具身智能與系統(tǒng)、硬件與內(nèi)核、云原生與虛擬化等領(lǐng)域探討最新技術(shù)趨勢和未來發(fā)展方向。其中,近年來愈發(fā)重視自主可控操作系統(tǒng)發(fā)展的智能汽車領(lǐng)域,也成為本屆會議的討
    的頭像 發(fā)表于 04-01 21:00 ?808次閱讀
    中國汽車報:睿賽德攜“程翧整車基礎(chǔ)軟件OS”亮相<b class='flag-5'>操作系統(tǒng)</b>年會

    芯盾時代全線產(chǎn)品完成鴻蒙操作系統(tǒng)深度適配

    近日華為推出首款全面搭載原生鴻蒙操作系統(tǒng)HarmonyOS 5的手機HUAWEI Pura X,標志著華為終端已全面進入原生鴻蒙的時代,預(yù)示著華為終端產(chǎn)品將為用戶帶來更加流暢、智能和安全的使用體驗。
    的頭像 發(fā)表于 03-28 09:38 ?751次閱讀

    鴻道Intewell操作系統(tǒng)的Linux實時拓展方案

    鴻道Intewell操作系統(tǒng)是科東軟件自主研發(fā)的新型工業(yè)實時操作系統(tǒng),歷經(jīng)30多年研發(fā)積累,采用業(yè)界領(lǐng)先的微內(nèi)核架構(gòu),具備高實時、高安全及強擴展的特性,是目前國內(nèi)唯一通過汽車、工業(yè)控制、醫(yī)療儀器、軌道交通四項功能安全認證的操作系統(tǒng)
    的頭像 發(fā)表于 02-27 10:08 ?604次閱讀
    鴻道Intewell<b class='flag-5'>操作系統(tǒng)</b>的Linux實時拓展方案

    國產(chǎn)銀河麒麟操作系統(tǒng)V10和星光麒麟V1.0操作系統(tǒng)如何選擇?

    國產(chǎn)銀河麒麟操作系統(tǒng)和星光麒麟操作系統(tǒng)都是由中國電子旗下科技企業(yè)麒麟軟件有限公司(簡稱“麒麟軟件”)開發(fā)的國產(chǎn)自主可控的操作系統(tǒng)。麒麟軟件介紹:麒麟軟件以安全可信操作系統(tǒng)技術(shù)為核心,面
    的頭像 發(fā)表于 01-24 09:14 ?4141次閱讀
    國產(chǎn)銀河麒麟<b class='flag-5'>操作系統(tǒng)</b>V10和星光麒麟V1.0<b class='flag-5'>操作系統(tǒng)</b>如何選擇?

    云服務(wù)器選擇什么操作系統(tǒng)好?

    云服務(wù)器選擇什么操作系統(tǒng)好?選擇云服務(wù)器操作系統(tǒng)需考慮業(yè)務(wù)需求、兼容性、安全性、易用性及成本。Linux系統(tǒng)如CentOS、Ubuntu和Debian因穩(wěn)定、免費且社區(qū)支持強大而受歡迎;WindowsServer適合運行特定Wi
    的頭像 發(fā)表于 01-21 10:56 ?727次閱讀

    華為新品出廠默認搭載原生鴻蒙系統(tǒng)

    華為近日宣布了一項重要決策,即2025年其手機、平板、穿戴等新品都將出廠默認搭載原生鴻蒙操作系統(tǒng)。這一舉措標志著華為在操作系統(tǒng)領(lǐng)域邁出了堅實的一步,也彰顯了其對自主技術(shù)的堅定信心和決心。 據(jù)了解
    的頭像 發(fā)表于 01-03 10:48 ?1615次閱讀

    deepin操作系統(tǒng)介紹

    希望從自己的能力和對桌面操作系統(tǒng)的理解,能給 Linux 的用戶與開發(fā)者更多的選擇。我們也相信 deepin 能夠得到更多用戶的認可與喜愛,成為開源世界的最佳選擇。? 一、 deepin 操作系統(tǒng) 先說 Linux 操作系統(tǒng),它
    的頭像 發(fā)表于 12-23 09:08 ?3201次閱讀
    deepin<b class='flag-5'>操作系統(tǒng)</b>介紹

    名單公布!【書籍評測活動NO.53】鴻蒙操作系統(tǒng)設(shè)計原理與架構(gòu)

    操作系統(tǒng)從2019年8月9日正式發(fā)布,歷時1778天,歷經(jīng)4代,鴻蒙生態(tài)設(shè)備數(shù)量已超過9億,已有254萬HarmonyOS開發(fā)者投入到鴻蒙世界的開發(fā)中來,鴻蒙學堂學習人次435萬,開發(fā)者服務(wù)調(diào)用次數(shù)
    發(fā)表于 12-16 15:10

    Alpine操作系統(tǒng)社區(qū)發(fā)布龍架構(gòu)版本

    近日,開源軟件世界和云計算領(lǐng)域重要的操作系統(tǒng)發(fā)行版社區(qū)Alpine Linux正式發(fā)布3.21最新版本,以完整的系統(tǒng)形態(tài)實現(xiàn)對龍架構(gòu)的原生支持,將有力促進龍架構(gòu)在云計算領(lǐng)域的生態(tài)建設(shè)和應(yīng)用拓展。
    的頭像 發(fā)表于 12-10 11:12 ?1080次閱讀

    如何在windows上emulate不同操作系統(tǒng)

    一、虛擬化技術(shù)概述 虛擬化技術(shù)允許在單個物理機器上創(chuàng)建多個虛擬機,每個虛擬機都可以運行不同的操作系統(tǒng)。這使得我們可以在Windows系統(tǒng)上模擬其他操作系統(tǒng),而無需購買額外的硬件。虛擬化技術(shù)的關(guān)鍵組件
    的頭像 發(fā)表于 12-05 15:50 ?1353次閱讀