作者:曲向軍,韓峰,胡藝蓉,王喆宸
沒有好問題,就沒有好答案: 為什么生成式AI全球增速都這么快? 為什么中國的增速遠(yuǎn)高于全球? 中國的短板有哪些?能補(bǔ)上嗎? 與傳統(tǒng)AI相比,生成式AI(GenAI)擁有四大優(yōu)勢,包括自動化和效率提升、個性化和定制化、創(chuàng)造性和創(chuàng)新能力、可解釋性和透明度。GenAI可通過提高生產(chǎn)效率、推動創(chuàng)新能力和改變競爭格局三大方式,為全球經(jīng)濟(jì)創(chuàng)造巨大價值。 麥肯錫全球董事合伙人韓峰曾說過,銀行業(yè)應(yīng)用GenAI的價值潛力主要來自“4C”:編程加速(Coding)、內(nèi)容提煉/虛擬專家(Concision)、客戶互動(Customer engagement)以及內(nèi)容生成(Content generation)。 比如,在編程加速方面,GenAI能夠解讀并生成代碼,使銀行的代碼編寫效率提升55%;通過虛擬專家,銀行一線人員能從非結(jié)構(gòu)化數(shù)據(jù)中歸納提取洞見、解讀文本,快速訪問所有相關(guān)信息以即時滿足客戶請求;在客戶互動領(lǐng)域,使用聊天機(jī)器人完成客戶觸達(dá)和數(shù)據(jù)收集,未來5-10年80%以上的客戶互動可被自動化;內(nèi)容生成方面,GenAI可應(yīng)用于生成文本、圖像等內(nèi)容。 本文來自《麥肯錫中國金融業(yè)CEO季刊》,版權(quán)歸麥肯錫所有。該季刊主要圍繞生成式AI(以下簡稱“GenAI”)主題,通過4大章節(jié)共8篇文章,全面深入分析了GenAI對各主要行業(yè)的影響、價值鏈投資機(jī)會、中國GenAI市場現(xiàn)狀和未來趨勢以及企業(yè)如何布局GenAI,從而真正挖掘其價值。
速看(TLDR): 總體來看,中國生成式AI市場正處于高速增長期,技術(shù)和應(yīng)用正在迅速發(fā)展。 1 全球生成式AI市場規(guī)模正在高速增長,2022年達(dá)400億美元,2032年預(yù)計達(dá)1.3萬億美元,復(fù)合增速42%。2022年中國生成式AI市場規(guī)模約660億元人民幣,2020-2025年復(fù)合增速可達(dá)84%,有望占全球比重14%。 2 中國生成式AI應(yīng)用集中在電商、傳媒、娛樂和游戲等行業(yè),大多數(shù)傳統(tǒng)行業(yè)還處于小規(guī)模試點。 3 中國生成式AI企業(yè)商業(yè)模式還在探索,主要包括云資源售賣、API調(diào)用、SaaS收費等。 4 中國在基礎(chǔ)設(shè)施和底層技術(shù)上存在一定制約,但正快速追趕,特別是在行業(yè)應(yīng)用模型方面。 5 生成式AI也帶來負(fù)面影響,中國面臨的主要風(fēng)險是模型幻覺、惡意使用和信息泄露。中國已經(jīng)出臺管理規(guī)定,美歐也在制定相關(guān)法規(guī),對生成式AI展開監(jiān)管。
正文: 隨著ChatGPT的火爆出圈,GenAI成為各行各業(yè)關(guān)注和熱議的話題。全球科技巨頭和AI廠商紛紛下場,唯恐錯過此番科技盛宴。行業(yè)翹楚和媒體將GenAI浪潮類比昔日的移動互聯(lián)網(wǎng)機(jī)遇,認(rèn)為它將對全球經(jīng)濟(jì)和各個行業(yè)帶來深遠(yuǎn)影響,企業(yè)也將迎來重大變革機(jī)遇。 GenAI蓬勃發(fā)展產(chǎn)業(yè)規(guī)模也在高速增長,投資者紛紛入局。2022年GenAI市場收入為400億美元,預(yù)計2027年及2032年將分別達(dá)到3,990億美元和13,040億美元,2022~2032年復(fù)合增長率達(dá)42%。
中國市場,2022年規(guī)模約人民幣660億元,2020~2025年復(fù)合增速將達(dá)到84% ,2025年中國GenAI市場將占全球市場規(guī)模(2,170億美元)的14%。
由于內(nèi)容較多一共178頁,下面主要為大家介紹中國GenAI市場現(xiàn)狀和未來趨勢。
市場規(guī)模
2022年全球GenAI市場整體收入為400億美元,預(yù)計2027年及2032年將分別達(dá)到3990億美元和1.3萬億美元,2022~2032年復(fù)合增長率高達(dá)42%。 到2025年,GenAI產(chǎn)生的數(shù)據(jù)將占所有生成數(shù)據(jù)的10%(2021年僅為1% 2)。
預(yù)計2022~2035年全球市場規(guī)模增量主要來源于訓(xùn)練側(cè)硬件、廣告應(yīng)用和軟件。其中,在訓(xùn)練側(cè)硬件方面的增量約4,440億美元,僅GenAI基礎(chǔ)設(shè)施服務(wù)(GenAI as a service)一項,增量就有2,448億美元,年復(fù)合增長率將達(dá)到60%; 在廣告應(yīng)用方面,相關(guān)年復(fù)合增長率將達(dá)到125%,增量達(dá)1924億美元;而軟件方面,在約2,800億美元的增量中,GenAI助理軟件增量可觀,達(dá)890億美元,年復(fù)合增長率有望達(dá)到70%。
2022年中國GenAI市場規(guī)模約人民幣660億元,預(yù)計2020~2025年復(fù)合增速將達(dá)84%,到2025年將占全球市場規(guī)模(2,170億美元)的13%。
與此同時,近兩年國內(nèi)GenAI融資市場熱度持續(xù)上升,前十大融資事件總規(guī)模達(dá)8.7億美元。 其中,某領(lǐng)先的端到端AI制藥公司、光某大模型初創(chuàng)公司等頭部企業(yè)獲得逾2億美元的單筆融資,多輪融資累計規(guī)模分別超3億美元、2.5億美元。
技術(shù)棧
(一)專用硬件:基礎(chǔ)建設(shè)資源受限,但國產(chǎn)化進(jìn)程不斷加速。
由于無法獲得高端GPU(圖形處理器)芯片A100與H100,國內(nèi)大模型研發(fā)機(jī)構(gòu)在算力上遭遇瓶頸。為應(yīng)對上述困境,中國本土芯片研發(fā)廠商加強(qiáng)科研,在算力技術(shù)上實現(xiàn)重要突破。
目前,中國市場可以獲得的A800 GPU芯片,傳輸速度僅為頂尖產(chǎn)品A100的70%。由于AI技術(shù)發(fā)展高度依賴先進(jìn)GPU,需借助芯片進(jìn)行大量模型訓(xùn)練和擴(kuò)展,部分國內(nèi)科研機(jī)構(gòu)和科技企業(yè)因此受到較大影響,尤其在目前大模型參數(shù)量快速膨脹、算力需求顯著增加的情況下。
為了應(yīng)對算力瓶頸,國內(nèi)領(lǐng)先算力芯片公司力求在產(chǎn)品端實現(xiàn)突破。例如,國內(nèi)某量產(chǎn)商業(yè)人工智能芯片廠商,在頭部大型云服務(wù)提供商旗下一款知識增強(qiáng)大語言模型產(chǎn)品中,實現(xiàn)了對部分業(yè)務(wù)場景的部署。 某專注于通用GPU芯片及解決方案研發(fā)及銷售的高科技公司和另一計算機(jī)圖形芯片設(shè)計公司則希望開發(fā)出接近高端芯片性能的產(chǎn)品。
全球領(lǐng)先的ICT(信息與通信)基礎(chǔ)設(shè)施和智能終端提供商旗下的人工智能處理器則被用于內(nèi)部大模型開發(fā)訓(xùn)練。 目前,國產(chǎn)GPU的算力規(guī)模大多在1000TOPS以內(nèi),上述某計算機(jī)圖形芯片設(shè)計公司已能達(dá)到2000TOPS,但距離國際領(lǐng)先的H100芯片高達(dá)4000TOPS的算力仍有一定差距。
(二)云平臺:全球競爭格局趨同,未來國內(nèi)GenAI廠商將依賴云平臺完成模型訓(xùn)練與調(diào)整。
在云平臺領(lǐng)域,國內(nèi)和海外市場均呈現(xiàn)頭部廠商占據(jù)絕對主導(dǎo)地位的壟斷格局。2022年,國內(nèi)四家頭部廠商占據(jù)國內(nèi)79% 4的市場份額;在海外市場,截至2023年一季度,前三大廠商占據(jù)全球65%的市場份額。
通用大模型需要海量數(shù)據(jù)作訓(xùn)練用途,但中文網(wǎng)站數(shù)量從全球來看占比僅為1.4% (英文網(wǎng)站占比達(dá)54% ),可用作訓(xùn)練的公開中文語料庫(含文本、圖片、視頻等素材)往往數(shù)量有限、質(zhì)量不均。
與此同時,國內(nèi)用戶在網(wǎng)站和移動端App產(chǎn)生的海量數(shù)據(jù),基于保護(hù)用戶隱私的原因,大部分也未能應(yīng)用在大模型訓(xùn)練上,對模型訓(xùn)練的效率和精度都造成不利影響。 盡管在訓(xùn)練數(shù)據(jù)上受到諸多限制,中國通用大模型技術(shù)仍然不斷追趕國際領(lǐng)先水平,參數(shù)規(guī)模緊跟國際領(lǐng)先水準(zhǔn)并實現(xiàn)快速提升。
相較于適用于多領(lǐng)域、多任務(wù)的通用大模型,行業(yè)大模型更依賴于開發(fā)者對垂直場景的理解和海量行業(yè)數(shù)據(jù)支持,在算力受限的背景下,行業(yè)大模型更有可能成為中國GenAI廠商的制勝賽道。 就行業(yè)大模型而言,國內(nèi)市場正呈現(xiàn)差異化競爭格局:某頭部互聯(lián)網(wǎng)大廠的行業(yè)大模型根植于游戲、廣告、內(nèi)容創(chuàng)作等多媒體領(lǐng)域,成為提升廣告和游戲場景創(chuàng)作效率的生產(chǎn)力工具;
國內(nèi)前三的超大規(guī)模云服務(wù)商開發(fā)的產(chǎn)業(yè)級知識增強(qiáng)大模型則憑借其對中文語言的強(qiáng)大理解能力,賦能汽車行業(yè)售后服務(wù)與知識庫構(gòu)建、醫(yī)療行業(yè)單據(jù)識別、社科行業(yè)版權(quán)保護(hù)與詞條管理等; 某全球領(lǐng)先的ICT(信息與通信)基礎(chǔ)設(shè)施和智能終端提供商旗下的包含NLP、CV、多模態(tài)和科學(xué)計算的中文大模型則在工業(yè)物流、新藥研發(fā)、氣象預(yù)測等領(lǐng)域得到廣泛應(yīng)用。
(三)基礎(chǔ)模型:通用大模型數(shù)量可觀,行業(yè)大模型可能是國產(chǎn)GenAI的出路。
在通用大模型方面,截至2023年5月,中國已發(fā)布79個10億參數(shù)級以上的大模型,在大模型發(fā)布數(shù)量上位居全球第二,僅次于美國。在全球模型發(fā)布數(shù)量前十的GenAI大模型廠商中,中國研發(fā)機(jī)構(gòu)及廠商占據(jù)4席。
通用大模型需要海量數(shù)據(jù)作訓(xùn)練用途,但中文網(wǎng)站數(shù)量從全球來看占比僅為1.4% (英文網(wǎng)站占比達(dá)54% ),可用作訓(xùn)練的公開中文語料庫(含文本、圖片、視頻等素材)往往數(shù)量有限、質(zhì)量不均。
與此同時,國內(nèi)用戶在網(wǎng)站和移動端App產(chǎn)生的海量數(shù)據(jù),基于保護(hù)用戶隱私的原因,大部分也未能應(yīng)用在大模型訓(xùn)練上,對模型訓(xùn)練的效率和精度都造成不利影響。 盡管在訓(xùn)練數(shù)據(jù)上受到諸多限制,中國通用大模型技術(shù)仍然不斷追趕國際領(lǐng)先水平,參數(shù)規(guī)模緊跟國際領(lǐng)先水準(zhǔn)并實現(xiàn)快速提升。
(四)模型庫和工具:國內(nèi)外圍繞開源模型,涌現(xiàn)出大模型工具獨立廠商。
海外市場圍繞可自由調(diào)整代碼的開源模型,已涌現(xiàn)出一批獨立廠商,可實現(xiàn)模型訓(xùn)練和微調(diào)、模型部署、模型應(yīng)用開發(fā)等細(xì)分技術(shù)功能。隨著國內(nèi)GenAI市場的不斷發(fā)展,各種開發(fā)和維護(hù)工具等也將逐漸成熟。
(五)應(yīng)用:中國創(chuàng)業(yè)公司尚處于早期階段,聚焦領(lǐng)域相對集中。
中國GenAI領(lǐng)域的創(chuàng)業(yè)公司融資輪次靠前,集中在天使輪到Pre-A輪之間,融資金額大多小于1億元人民幣,正處于方興未艾的發(fā)展初期,行業(yè)潛力巨大。
其中,某全球領(lǐng)先的跨國科技公司旗下的人工智能聊天機(jī)器人作為準(zhǔn)獨角獸企業(yè),于2022年11月完成10億元A+輪融資,投后估值約10億美元。
反觀海外GenAI行業(yè),科創(chuàng)企業(yè)規(guī)模體量相對較大,涌現(xiàn)出多家細(xì)分應(yīng)用領(lǐng)域獨角獸企業(yè),其中某總部位于倫敦的全球化AI研究型企業(yè)估值高達(dá)38億美元。
中國GenAI垂直應(yīng)用領(lǐng)域主要聚焦文本、圖像和音視頻生成,海外市場則在上述領(lǐng)域以外出現(xiàn)了大量基于GenAI的開發(fā)平臺、數(shù)據(jù)分析平臺及代碼編寫平臺,其原因在于海外以早期程序語言(如COBOL)編寫的系統(tǒng)較多,許多企業(yè)面臨較高編程人力成本,因此對編程輔助軟件有較高需求。
同時,目前中國GenAI企業(yè)目標(biāo)客群多為終端用戶,而海外市場存在大規(guī)模企業(yè)客戶群體,隨著中國SaaS市場成熟以及企業(yè)付費意愿提升,預(yù)計國內(nèi)文本生成和圖像生成初創(chuàng)企業(yè)將快速拓展至企業(yè)客戶市場。
商業(yè)化應(yīng)用? ?
中國GenAI行業(yè)的商業(yè)化應(yīng)用呈現(xiàn)出兩大特點:一是行業(yè)分布集中,主要集中在商業(yè)化發(fā)展較成熟的優(yōu)勢產(chǎn)業(yè);二是大部分企業(yè)尚處于積極探索自身商業(yè)模式的早期階段。
(一)中國GenAI應(yīng)用集中于商業(yè)化發(fā)展成熟的優(yōu)勢產(chǎn)業(yè)
中國GenAI企業(yè)利用國內(nèi)垂直場景優(yōu)勢,將GenAI優(yōu)先應(yīng)用于商業(yè)化基礎(chǔ)設(shè)施較完善的新興行業(yè)中;而歐美同行則利用當(dāng)?shù)爻墒斓腟aaS市場,將GenAI應(yīng)用到高科技、通信及各種傳統(tǒng)行業(yè)(如醫(yī)療、教育等),應(yīng)用范圍更加廣泛。
在國內(nèi),GenAI應(yīng)用發(fā)展最迅速的領(lǐng)域包括電商、傳媒、娛樂和游戲,尤其是數(shù)字虛擬人和電商視頻營銷,而大部分傳統(tǒng)行業(yè)(如金融、能源、教育等)仍處于小規(guī)模試點階段。 GenAI應(yīng)用得以在互聯(lián)網(wǎng)電商平臺蓬勃發(fā)展,原因在于中國擁有優(yōu)質(zhì)的電商和供應(yīng)鏈生態(tài)以及龐大的消費者群體,為GenAI應(yīng)用落地提供了契機(jī)。
典型的行業(yè)應(yīng)用案例包括視頻行業(yè)的某生成式AI的3D短視頻內(nèi)容廠商、電商行業(yè)的某領(lǐng)先GenAI視頻大模型研發(fā)企業(yè)以及游戲行業(yè)的某互聯(lián)網(wǎng)平臺旗下的游戲與AI研究和應(yīng)用機(jī)構(gòu)等。 上述企業(yè)中,生成式AI的3D短視頻內(nèi)容廠商能夠基于文本生成3D視頻內(nèi)容,并通過抖音、快手、B站等短視頻平臺進(jìn)行推廣,極大提高了短視頻內(nèi)容生產(chǎn)者的創(chuàng)作效率;
GenAI視頻大模型研發(fā)企業(yè)則深耕電商行業(yè),以AI生成虛擬人主播,賦能各行業(yè)、各品牌電商;游戲與AI研究和應(yīng)用機(jī)構(gòu)則利用人工智能打造AI陪玩、AI競技機(jī)器人,并通過自然語言技術(shù)賦予非玩家角色人設(shè),使其能夠在游戲中與玩家互動對話。
(二)中國市場GenAI商業(yè)模式尚在探索中
目前,大部分中國市場的GenAI創(chuàng)業(yè)公司剛剛完成標(biāo)準(zhǔn)化產(chǎn)品輸出,開始進(jìn)入初級商業(yè)化探索階段,市場上主流的商業(yè)模式包括云資源售賣、模型API調(diào)用、SaaS收費、素材收費等。
由于國內(nèi)企業(yè)對軟件的付費意愿不高、市場有待進(jìn)一步培育,以及企業(yè)對SaaS部署方式存在數(shù)據(jù)安全方面的顧慮,大規(guī)模應(yīng)用GenAI的商業(yè)模式仍有待探索。 在歐美市場,SaaS付費訂閱模式已基本成熟,一眾海外GenAI企業(yè)紛紛構(gòu)建起可持續(xù)的SaaS商業(yè)模式。
風(fēng)險管理
GenAI賦能各行各業(yè)的同時,也帶來了諸如公平性受損、侵犯知識產(chǎn)權(quán)、信息泄露、惡意使用、安全威脅、模型幻覺及第三方風(fēng)險等負(fù)面影響和挑戰(zhàn)。其中,模型幻覺、惡意使用、信息泄露三大風(fēng)險值得重點關(guān)注。
惡意使用:不當(dāng)使用模型輸出可能會帶來欺詐、虛假信息傳播等負(fù)面影響,中國GenAI應(yīng)用豐富、用戶群體龐大,所面臨的惡意使用風(fēng)險較為突出,但由于國內(nèi)在實名認(rèn)證,內(nèi)容合規(guī),和打擊虛假信息等方面落實到位,有利于追溯惡意使用源頭,從而防范和控制相關(guān)風(fēng)險。 信息泄露:用于模型訓(xùn)練的隱私或敏感信息可能會被GenAI應(yīng)用作為輸出內(nèi)容,同時人工智能模型存儲系統(tǒng)內(nèi)的個人信息也可能面臨網(wǎng)絡(luò)攻擊和泄漏,因此需要在內(nèi)部部署數(shù)據(jù)、又處于強(qiáng)監(jiān)管下的重點行業(yè)和企業(yè),需要主動防范信息泄露風(fēng)險。
安全威脅:不僅負(fù)責(zé)任的AI(RAI-Responsible AI)受到監(jiān)管和企業(yè)關(guān)注,安全的AI(SAI-Securing AI)也逐漸進(jìn)入企業(yè)和公眾視野,特別是AI系統(tǒng)全生命周期安全保護(hù)。有效的AI威脅管理直接影響到防范信息泄露和惡意使用。近期全國信息安全標(biāo)準(zhǔn)化技術(shù)委員會起草了相關(guān)評估規(guī)范和標(biāo)準(zhǔn),為算法提供者給與了機(jī)器學(xué)習(xí)算法生命周期安全指導(dǎo)意見7,也可為監(jiān)管評估提供參考。
模型幻覺:模型輸出結(jié)果不符合事實。模型幻覺普遍存在于國內(nèi)外所有的GenAI模型和應(yīng)用,但因為國內(nèi)大模型的研發(fā)經(jīng)驗和技術(shù)實力尚有提升空間,且中文語料相比英文更為復(fù)雜,讓模型幻覺問題變得更加棘手。
為規(guī)范GenAI的應(yīng)用,中國早在2022年已經(jīng)開始布局AI相關(guān)監(jiān)管,例如2022年3月發(fā)布了互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定,2022年11月發(fā)布了互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定。 2023年7月,國家網(wǎng)信辦聯(lián)合國家發(fā)展改革委、教育部、科技部等7部門發(fā)布《生成式人工智能服務(wù)管理暫行辦法》,對模型訓(xùn)練過程中可能涉及的數(shù)據(jù)歧視、知識產(chǎn)權(quán)保護(hù)、個人隱私及肖像權(quán)保護(hù)等作出明確規(guī)定,行業(yè)監(jiān)管框架進(jìn)一步完善。
放眼海外,美國國家標(biāo)準(zhǔn)與技術(shù)研究院于2023年1月發(fā)布了AI風(fēng)險管理框架,著力為AI開發(fā),治理,和運營提供風(fēng)險控制最佳實踐。歐盟則于2023年6月通過《人工智能法案》授權(quán)草案,對不同等級的人工智能所承擔(dān)的責(zé)任和義務(wù)進(jìn)行劃分,通過風(fēng)險定級來實現(xiàn)分層治理,并著力推動跨產(chǎn)業(yè)的人工智能立法,以進(jìn)一步防范人工智能可能帶來的多重風(fēng)險。
結(jié)語
當(dāng)下全球人工智能市場正處于高速增長階段,本文從市場規(guī)模、技術(shù)棧、商業(yè)化應(yīng)用和風(fēng)險管理四大維度,對國內(nèi)外GenAI行業(yè)的發(fā)展現(xiàn)狀和趨勢進(jìn)行了深入淺出的分析。
盡管目前國內(nèi)外市場在諸如大模型開發(fā)、應(yīng)用布局、商業(yè)模式等多個領(lǐng)域都存在較大差異,我們看到中國GenAI行業(yè)正在不斷追趕國際領(lǐng)先水平,預(yù)計未來中國GenAI相關(guān)技術(shù)和應(yīng)用將逐漸成熟,并進(jìn)一步探索出適合自身發(fā)展的商業(yè)模式。 ?
編輯:黃飛
評論