提供AI算力的另一種方式。
大模型時代,云計算廠商如何賺錢?
最常見的方式是提供算力。大模型需要大算力,因此,對算力尤其是英偉達GPU的巨額投入是不可或缺的。英偉達曾透露,2023財年數(shù)據(jù)中心業(yè)務有40%的收入來自超大規(guī)模數(shù)據(jù)中心與云服務商。
但現(xiàn)在,云計算廠商又多了一門新生意。
近期,有“混合云第一股”之稱的云廠商青云科技推出了兩款新的云產(chǎn)品——AI算力調(diào)度平臺與AI算力云。AI算力調(diào)度平臺是一款軟件產(chǎn)品,它介于底層的資源層與上層的模型層之間,通過整合不同來源、類型和架構的算力資源,實現(xiàn)統(tǒng)一調(diào)度與運營,為用戶提供按需獲取和調(diào)度的服務;AI算力云,就是以青云為主來運營的AI算力服務。
這兩款AI算力產(chǎn)品與服務針對的是算力中心的短期建設與中長期運營的需求。青云科技總裁林源表示,今天中國云計算市場處在算力建設階段,大量的數(shù)據(jù)中心如雨后春筍般出現(xiàn),這些建設者有地方政府、國資央企、地方AI集成商等。對于建設者而言,成本與技術的挑戰(zhàn)都很大,比如一臺最新的一臺英偉達服務器高達200萬元。如此大的投資,怎么建?建成之后如何運營,如何賺錢?這些問題都需要有人來解決。
青云科技的AI算力調(diào)度平臺已經(jīng)成功服務于國家超算濟南中心。濟南超算中心是一個多元計算中心,對外提供1000P算力、300PB存儲,算力類型包括HPC超算,主要服務于山東省的高校;以CPU為主的通用算力,主要服務于傳統(tǒng)的政務云、企業(yè)數(shù)字化應用;以GPU為主的智算,主要服務于智慧城市,以及正在爆發(fā)的AI需求。
濟南超算中心的建設覆蓋了幾乎所有產(chǎn)業(yè)鏈上下游公司,但青云科技為其獨家提供了算力調(diào)度平臺,至今已經(jīng)運營了3年。濟南超算中心目前已經(jīng)盈利。
對于AI算力云服務,不同于大廠選擇重金投入GPU來獲取稀缺的算力資源,青云科技采用了“輕資產(chǎn)”運營,以生態(tài)合作的方式共同運營AI算力。
以濟南超算中心為例,建成之后不僅服務于當?shù)仄髽I(yè),也會服務于全國其他地區(qū)的企業(yè)。當青云科技的客戶有算力需求,青云科技可以通過直接調(diào)度濟南超算的算力向客戶提供AI算力資源。因此,青云科技既是濟南超算的供應商,也是其渠道商。
這樣的案例不在少數(shù)。青云科技已經(jīng)與北京、寧夏、河南、湖北、四川等地區(qū)的算力中心建立起合作關系。
在2023年半年報中,青云科技披露AI算力服務的收入超2000萬元。林源表示,未來AI算力產(chǎn)品與服務將會成為青云科技營收的主力。
過去十年,中國的云計算市場一共經(jīng)歷了三次比較大的機會。第一次是數(shù)字化,移動數(shù)字化催生了公有云,產(chǎn)業(yè)數(shù)字化催生了私有云;第二次是信創(chuàng)與國產(chǎn)替代。而當前爆發(fā)的生成式AI,就是第三次大機會。
林源認為,2023年由GPU驅(qū)動的智算,正如十年前的2013年由CPU驅(qū)動的通用云計算。而這一次的市場規(guī)模,要比過去大10倍、甚至100倍。
近期,「甲子光年」等媒體采訪了青云科技總裁林源,青云科技產(chǎn)品經(jīng)理苗慧。以下是專訪實錄,略經(jīng)刪改:
1.與大廠定位不同
問:青云的算力調(diào)度產(chǎn)品有哪些特色?
苗慧:簡單舉幾個例子。第一,青云針對上百臺機器的大集群,研發(fā)了更加優(yōu)化的調(diào)度算法。比如在調(diào)度的鏈路標簽上,盡可能做到調(diào)度同一個交換機,減少數(shù)據(jù)的損耗。第二,在應用環(huán)境上,青云應用了K8s和Slurm兩種調(diào)度平臺同時為客戶服務,是完全集成好的。在顆粒度和運維傳統(tǒng)機器方面,也會有更多的優(yōu)化。
圖片來源:青云科技
問:大廠、運營商、私有云廠商也有軟件能力,為什么說青云的AI算力調(diào)度運營是青云科技的優(yōu)勢?
林源:首先,私有云廠商想做,需要補齊十幾年公有云運營的經(jīng)驗。第二,大廠的定位一定是發(fā)展自己的云,而不是支持別人去做云,或者說支持第三方做云只是他的一個項目而已,主力還在自己的云產(chǎn)品與服務。
苗慧:比如對于國家超算的人員配置,根本沒有研發(fā)這個崗位,全都是運維人員。用戶通過青云AI算力調(diào)度平臺,申請10臺機器,5分鐘內(nèi)就能得到。否則,運維人員需要兩個人部署三天,這就是更多的投入。
問:英偉達今年發(fā)布了AI云產(chǎn)品DGX Cloud,青云的產(chǎn)品和英偉達DGX Cloud在定位上有沒有相似?
苗慧:DGX-Cloud還是基于硬件。英偉達在今年發(fā)布了24臺機器的整機,巨大的機器上云一定會有優(yōu)勢。但DGX Cloud不在中國區(qū)運營,從資源層和運營層都是其自身的。青云的算力調(diào)度產(chǎn)品不僅自己的公有云能用,還能給到任何一家算力中心。
林源:英偉達DGX Cloud還是單一算力,肯定以GPU為主。站在英偉達的角度,他服務于大模型的訓練、推理,定位就是面對AI的場景,以及賣GPU卡。而青云科技根據(jù)中國市場國情,需要向下兼容,不同的客戶需要的芯片算力種類不同,既有GPU,也有CPU、超算。比如我們跟英特爾9系列做適配,一個芯片2T內(nèi)存,在推理場景比英偉達還要好一些。青云的算力調(diào)度平臺,針對的是多元算力。
2.“輕資產(chǎn)”提供AI算力
?
問:青云自身在算力上的投入是怎樣的?
林源:GPU不太一樣,青云不會跟云大廠拼投資,而是以相對“輕資產(chǎn)”的方式與別人一起運營AI算力云。青云是聯(lián)合運營方,投資的是技術與產(chǎn)品,但不會花1個億買幾百張卡、幾百臺服務器。重資產(chǎn)不是青云的價值所在。
問:那誰來做算力層面的投入?
林源:目前來看,算力層面上的投資建設者主要有以下幾種:第一種是地方國企和地方央企,例如能源公司,他們有強烈的興趣將電力轉(zhuǎn)變成算力。第二種是地方政府,他們需要新的工具來促進產(chǎn)業(yè)聚集,提升GDP,有些直接進行投資,有些與央企或銀行合作。第三種是大模型公司、AI芯片公司等,他們在各地都參與建立了算力中心,但缺乏標準平臺,他們也想銷售硬件或整合解決方案,通常更愿意與獨立的供應商合作。我們之間互為渠道伙伴,青云協(xié)助他們進行計算資源調(diào)度,并一起提供AI計算資源云服務。
以濟南超算為例,濟南超算會基于他投資的算力直接賣給他的客戶,青云也會出售給青云的客戶,青云既是他的供應商,也是他的渠道商。未來所有的本地數(shù)據(jù)中心建設都會面臨這個問題,當?shù)仄髽I(yè)會消費一部分,剩余部分他會希望有人幫他消耗。AI算力云與算力調(diào)度中心是青云的同構產(chǎn)品,可以進行系統(tǒng)級的產(chǎn)品對接。
圖片來源:青云科技
問:除了和濟南超算有合作外,還有其他的合作方嗎?
林源:跟北京、寧夏、河南、湖北、四川等地區(qū)有合作。北京是以高校為主,寧夏是地域性的算力投資建設者,四川、湖北是能源公司,河南是地方政府。還有一些小城市,主要是一些AI合作伙伴,對接當?shù)氐乃懔χ行暮?,用青云的調(diào)度平臺做賦能。
問:青云自己提供云服務和青云給甲方提供算力調(diào)度服務,會成為一種競合的關系嗎?
林源:我們先看下市場現(xiàn)狀,為什么會有那么多供應商和地區(qū)云、國資云、地方私有云平臺呢?這是中國的市場形態(tài)決定的,每個人都有所屬的客戶和資源。AI來了之后,市場會不一樣嗎?我覺得不會那么快改變。
問:很多大模型廠商會選擇自己買卡,這類廠商對于青云科技的AI算力云還有需求嗎?
林源:大模型廠商自己的規(guī)劃中,有相對固定的部分,他會更愿意買卡,因為現(xiàn)金充裕,會更加可控,這部分跟青云確實沒太大關系。但在模型訓練階段、項目落地階段,有很多彈性需求,比如他需要訓練行業(yè)模型,同時希望跟一場算力云廠商合作提供MaaS的服務。大模型公司一定會買一部分,自建一部分。
問:目前市場上算力資源不夠,怎么辦?
林源:算力不夠的核心是GPU的供貨問題,不在于我們。用戶一般是簽完合同后等著我們的算力供應,所有廠商都面臨相同的問題。但是不同廠商的解法不一樣,大廠是靠錢買,青云的方式是與合作伙伴一起。青云的核心是調(diào)度平臺,但不妨礙青云一起給客戶提供AI算力云。
問:在青云開放同盟中,有哪些廠商?青云處于什么地位?
林源:可以分為技術生態(tài)和商業(yè)生態(tài)。技術生態(tài)的第一層是GPU、CPU等異構芯片;第二層是模型生態(tài)(MaaS),包括主流的商業(yè)大模型、開源大模型。在芯片層跟模型層之間,就是算力調(diào)度層。算力調(diào)度層不僅靠青云,也有很多廠商在做模型的加速和模型的驅(qū)動。技術生態(tài)還有一環(huán),就是行業(yè)ISV。
商業(yè)生態(tài),包括我們說的智算中心建設方,以及天然就能幫你售賣的合作伙伴。
問:在AI時代,大家合作的意愿會比以前更強嗎?在巨大的市場紅利面前,為什么會愿意收益共享?
林源:先談主觀看法,我認為有必要這么做,大家就應該各司其職、合作共贏?,F(xiàn)在持這種想法的不只青云一家。哪怕是客戶,也不希望一家獨大,不希望被一家廠商綁定。他希望在每一個細分領域找到最優(yōu)秀的人,為他提供整體解決方案。這是一個正常的、合理的商業(yè)模式。
第二點是客觀。一家企業(yè)很難從底層資源到上層應用,自己把做有事情做好,AI時代這會比過去更難。現(xiàn)在的經(jīng)濟環(huán)境,要核算投入產(chǎn)出比,需要成為所有行業(yè)的專家,才能“單打獨斗”,這是一個客觀的挑戰(zhàn)。
問:AI會給現(xiàn)有的云廠商格局帶來一些什么樣的變化?青云如何定位自己未來的位置?
林源:AI一定會對于現(xiàn)在的云廠商帶來變化。第一,對于底層技術的需求,以及對于合作的模式,都在發(fā)生變化。
第二,現(xiàn)在所有人都在同一起跑線上。我判斷會有一些新晉做AI Cloud的公司進入市場。傳統(tǒng)的IDC已經(jīng)不適合GPU運行,因為能耗、設計都不一樣,傳統(tǒng)IDC面臨改造升級。
第三,有些云廠商自己也做大模型,青云科技不做,而是深耕AI算力調(diào)度平臺。面對新的AI應用需求,大家需要很多技術積累、技術迭代,這特別像2013年的云時代。
在資本側,確實可以自己投資建設,但現(xiàn)在AI不缺投資者與建設者,缺的是運營平臺。資本會有影響,但不會像以前那么大。
總結來說,大廠在技術與資本層面并沒有明顯的優(yōu)勢。我們?yōu)槭裁磽肀I,因為AI是唯一的增長市場。2017年之前,大家不會考慮增量市場的問題,但之后客戶應用在飽和,越來越多的云廠商冒出來,這時候大廠靠自己的品牌以及價格優(yōu)勢在公有云市場上來搶奪機會?,F(xiàn)在大家忙的不是競爭,而是在AI時代如何為客戶更好地服務,解決算力問題。
3.AI會成為未來營收主力
問:青云科技的半年報顯示,今年上半年AI算力服務的收入有2000多萬元。青云的算力產(chǎn)品與服務,未來可以帶來多大的營收?有哪些期待?
林源:營收數(shù)字以公開的財報口徑為準。但基本上有這樣一個趨勢:AI算力現(xiàn)在更多以訓練為主,之后我們希望它進入推理階段。訓練的增速是可以期待的,2023年以GPU為主的算力云,就跟2013年以CPU為主的云一模一樣。2013-2017這幾年,所有云廠商都是100%的增長。
問:AI算力是一個很大的市場,但AI算力調(diào)度是否只是其中一小部分市場?
林源:我們看的是兩塊,第一塊AI算力調(diào)度本身,這有點像原來傳統(tǒng)交付模式的生意。第二塊是AI算力云,它既有產(chǎn)品的部分,也有服務的部分。這一部分未來十年的市場空間更大,我覺得是10倍、100倍的增長,而青云科技至少會比上一階段做到的規(guī)模更大。
問:青云現(xiàn)在的營收主力還是私有云,未來AI算力調(diào)度會成為營收的主力嗎?
林源:我覺得它一定會成為主要的營收,但是它需要點時間。過去青云最早做數(shù)字化、做信創(chuàng)業(yè)務,尤其過去兩年信創(chuàng)占私有云很大一部分,這不是青云決定的,而是市場決定的。之后所有的客戶都會往AI遷移,不管是傳統(tǒng)客戶還是互聯(lián)網(wǎng)客戶,生意模式與運營模式都會由AI驅(qū)動。如果不做AI,真的會落后。所以,它一定會成為主營的業(yè)務。
問:在AI算力服務這一塊,客戶需求比較旺盛的主要集中在哪幾個領域?
苗慧:主要就是訓練?,F(xiàn)在大模型作為技術基礎,在上層面向不同的行業(yè)。只要能標準化的,都在大規(guī)模地做模型的訓練,然后生產(chǎn)出自己的小模型。在理解人類意圖的時候,意圖模型也隨之更新。所以,如果我要做一個行業(yè),大概要訓練3~5個小模型,為這個行業(yè)提供服務。
問:青云算力調(diào)度平臺是一個標準化平臺嗎?在行業(yè)的應用上有沒有差別?
林源:青云對算力調(diào)度平臺的定位就是“產(chǎn)品”,產(chǎn)品就是標準化的。在濟南超算這一客戶中,會有客制化的部分,但那是他要做的事情,不是青云要做的事情。青云的定位始終是一家軟件產(chǎn)品公司,而不是一家項目公司。
問:青云現(xiàn)階段更希望吸引什么樣的行業(yè),或者什么樣的行業(yè)有更大的意愿采用這一產(chǎn)品?
苗慧:青云AI算力調(diào)度平臺主要服務于超算中心、區(qū)域算力中心、區(qū)域電信、區(qū)域的一些合作伙伴,我們共同建設起那朵云,共同運營。
第二是青云公有云的AI算力云,主要服務于大模型的開發(fā)商。因為大模型開發(fā)商也在面向客戶提供一些像金融領域的模型、交通領域的模型,它需要大規(guī)模的機器進行訓練,青云還是面向于這種模型提供商比較多。
第三是青云計劃今年年底或者明年,大規(guī)模的推理就會上云,因為大規(guī)模的訓練研發(fā)工作會有一個階段性的成果,推理服務會是之后相對重點的工作。
-
云計算
+關注
關注
39文章
7993瀏覽量
142115 -
AI
+關注
關注
88文章
37065瀏覽量
290327 -
算力
+關注
關注
2文章
1327瀏覽量
16416 -
大模型
+關注
關注
2文章
3351瀏覽量
4730
原文標題:AI算力調(diào)度平臺,大模型時代云計算的新生意|甲子光年
文章出處:【微信號:jazzyear,微信公眾號:甲子光年】歡迎添加關注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
“四算合一”算力平臺,芯片國產(chǎn)化率超九成,兼容8種國產(chǎn)AI芯片
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的未來:提升算力還是智力
睿海光電領航AI光模塊:超快交付與全場景兼容賦能智算時代——以創(chuàng)新實力助力全球客戶構建高效算力底座
積算科技上線赤兔推理引擎服務,創(chuàng)新解鎖FP8大模型算力
梯度科技助力客戶破解算力調(diào)度難題
圖為科技與寶德計算達成戰(zhàn)略合作 共建AI算力新生態(tài)

評論