“AI 2.0時(shí)代,垂直領(lǐng)域的數(shù)據(jù)會(huì)成為重要的生產(chǎn)資料,并帶來(lái)新的生產(chǎn)力突破。” 商湯科技董事長(zhǎng)兼CEO徐立在“人工智能與數(shù)據(jù)要素產(chǎn)業(yè)生態(tài)大會(huì)”上說(shuō)。
作為第七屆數(shù)字中國(guó)建設(shè)峰會(huì)的重要組成部分,人工智能與數(shù)據(jù)要素產(chǎn)業(yè)生態(tài)大會(huì)在福州正式召開(kāi)。商湯科技董事長(zhǎng)兼CEO徐立與中國(guó)工程院院士陳純、中國(guó)工程院院士鄧中翰、中國(guó)科學(xué)院院士林圣彩等一同出席,徐立發(fā)表主旨演講,分享了商湯科技在探索新質(zhì)生產(chǎn)力發(fā)展過(guò)程中,對(duì)于大模型產(chǎn)業(yè)化路徑的獨(dú)特見(jiàn)解與實(shí)踐經(jīng)驗(yàn)。
會(huì)上,商湯與福建實(shí)達(dá)集團(tuán)達(dá)成戰(zhàn)略合作,雙方將在人工智能算力建設(shè)、智慧城市、智慧應(yīng)急、人工智能教育、城市能源管理等領(lǐng)域展開(kāi)合作,推動(dòng)福建人工智能產(chǎn)業(yè)創(chuàng)新,助力“數(shù)字中國(guó)”建設(shè)。
遵循尺度定律,
小模型也能具備大模型的能力
Scaling Law(尺度定律)被認(rèn)為是大模型時(shí)代的“牛頓定律”,也是指導(dǎo)人工智能發(fā)展的基本法則,即隨著模型參數(shù)量、數(shù)據(jù)量、算力的增加,模型的性能也會(huì)勇往直前不斷提升。 之所以稱之為“尺度定律”而非“規(guī)模定律”,因?yàn)樗且粋€(gè)資源調(diào)配的“指示器”。具體而言,尺度定律具有兩個(gè)特性:
可預(yù)測(cè)性:可以跨越5~7個(gè)數(shù)量級(jí)尺度依然保持對(duì)性能的準(zhǔn)確預(yù)測(cè);
保序性:可以在小尺度上驗(yàn)證性能優(yōu)劣,并在更大尺度上依然保持。
尺度定律可以指導(dǎo)我們?cè)谟邢薜难邪l(fā)資源上,找到最優(yōu)的模型架構(gòu)和數(shù)據(jù)配方,讓較小的模型也能具備大模型的能力。
從以上實(shí)驗(yàn)數(shù)據(jù)可以看出,小模型在優(yōu)化數(shù)據(jù)的情況下,性能上可以逼近甚至超越跨數(shù)量級(jí)的大模型。這背后,主要源于高質(zhì)量的數(shù)據(jù)要素。
用戶體驗(yàn)是大模型最重要標(biāo)志,
感知理解和內(nèi)容生成雙輪循環(huán)
最新發(fā)布的GPT-4o和谷歌Gemini,為AI行業(yè)帶來(lái)了啟發(fā)——流暢的體驗(yàn)是決定大模型好壞最重要標(biāo)志。流暢的體驗(yàn)來(lái)自實(shí)測(cè)問(wèn)題上的性能,這與數(shù)據(jù)強(qiáng)相關(guān),而要獲得強(qiáng)大的數(shù)據(jù)能力,則需打通“感知理解”與“內(nèi)容生成”的雙輪循環(huán)。 回顧過(guò)去十年,人工智能主要解決對(duì)世界感知理解的問(wèn)題,今天則進(jìn)入了生成智能的時(shí)代。
如果要提升模型性能,感知理解和內(nèi)容生成能力兩者需相輔相成,互相協(xié)同。理解可以助力生成,而生成又可以反向推動(dòng)理解能力的提升,進(jìn)而形成互相循環(huán)的飛輪。
商湯「日日新5.0」大模型體系正是通過(guò)感知算法和生成算法協(xié)同研發(fā),實(shí)現(xiàn)了強(qiáng)大的多模態(tài)感知理解和生成能力,并帶來(lái)了出色的用戶體驗(yàn)。在感知理解能力方面,不僅可以精準(zhǔn)解讀并理解圖像內(nèi)容,進(jìn)行問(wèn)題解答及互動(dòng),還能掌握話題及其背后深層含義。如果沒(méi)有深層次的多模態(tài)感知理解能力,那么大模型的水平只能停留在淺層的知識(shí)記憶。
基于深度的多模態(tài)理解能力,「日日新5.0」能夠精準(zhǔn)理解圖片背后隱藏的中國(guó)文化內(nèi)涵
在生成能力方面,「日日新5.0」建立在深層次的場(chǎng)景和語(yǔ)言理解能力基礎(chǔ)上,由此能夠精準(zhǔn)把握畫(huà)作中場(chǎng)景氛圍和內(nèi)容的表達(dá)。
人像是評(píng)估文生圖能力的關(guān)鍵場(chǎng)景之一,「日日新 5.0」生成的人像可以看出非常好皮膚的紋理,而其他幾個(gè)大模型在皮膚上都做了磨皮
在很多垂直領(lǐng)域,中國(guó)有大量早期發(fā)展積累下來(lái)的知識(shí),用好這些知識(shí),就能做出差異化的生成效果。在AI 2.0即生成式人工智能時(shí)代,垂直領(lǐng)域的數(shù)據(jù)會(huì)成為重要的生產(chǎn)資料,并帶來(lái)新的生產(chǎn)力突破。如果模型生產(chǎn)出來(lái)之后,又能夠利用好這些數(shù)據(jù)對(duì)外服務(wù),再次數(shù)據(jù)資產(chǎn)化,就能形成一個(gè)不斷迭代的數(shù)據(jù)飛輪。
高效的響應(yīng)速度,
是大模型能力產(chǎn)業(yè)化的核心
其實(shí),最新的GPT-4o綜合能力略弱于GPT-4,但由于響應(yīng)速度極快,反而可以帶來(lái)更出色的使用體驗(yàn)。
商湯端側(cè)大模型全面對(duì)標(biāo)甚至超過(guò)GPT-4。來(lái)看一項(xiàng)有趣的評(píng)測(cè):將日日新·端側(cè)大語(yǔ)言模型SenseChat-Lite和GPT-4都接入到著名街機(jī)游戲《街霸》中進(jìn)行對(duì)決。雖然GPT-4能夠輸出連招和復(fù)雜的動(dòng)作,但SenseChat-Lite的出拳速度更快、動(dòng)作更敏捷,拳拳到位,最終獲得了勝利。
紅色KEN是商湯日日新端側(cè)模型操縱,
綠色KEN是GPT-4操縱 這項(xiàng)評(píng)測(cè)并非比較模型性能的強(qiáng)弱,而是展示了在該場(chǎng)景下,小模型的響應(yīng)速度更快。所以,只要找到合適的模型,產(chǎn)業(yè)化落地也會(huì)變得非???。
SenseChat-Lite 1.8B作為商湯今年4月發(fā)布的端側(cè)大模型,核心指標(biāo)全面領(lǐng)先所有開(kāi)源2B同級(jí)別模型,甚至在大部分測(cè)試中跨級(jí)擊敗了一些7B、13B模型。 當(dāng)然,單純的端側(cè)模型,性能自然比不過(guò)千億參數(shù)的云端大模型。但通過(guò)端云協(xié)同方案,將少數(shù)任務(wù)交給云端完成,而大部分任務(wù)放在端側(cè),可以大大減少推理成本和提升響應(yīng)速度。 比如,在部分特定任務(wù)中,只需要調(diào)用30%的云端模型能力,就能獲得90%~95%的性能體驗(yàn),在不損失精度的同時(shí),降低了70%的推理成本。
在性能方面,商湯的端側(cè)大語(yǔ)言模型擁有業(yè)內(nèi)最快的推理速度。比如,人眼睛最快的閱讀數(shù)字是每秒20個(gè)字,而商湯的端側(cè)大語(yǔ)言模型可在旗艦平臺(tái)達(dá)到78.3字/秒。 擴(kuò)散模型同樣可在端側(cè)實(shí)現(xiàn)業(yè)內(nèi)最快的推理速度。在某主流平臺(tái)上,商湯端側(cè)擴(kuò)散模型的推理速度單張約1.0秒,比友商云端App快10倍,并且支持在端上快速進(jìn)行等比擴(kuò)圖、自由擴(kuò)圖、旋轉(zhuǎn)擴(kuò)圖等圖像編輯功能。
由于響應(yīng)速度更快,覆蓋面更廣,端側(cè)應(yīng)用是生成式大模型落地的重要載體。
比如日常對(duì)話、常識(shí)問(wèn)答、文案生成、相冊(cè)管理、圖片生成以及圖片擴(kuò)展等應(yīng)用,都可以賦能包括手機(jī)、平板電腦、VR眼鏡、車載電腦在內(nèi)的海量終端設(shè)備。 《時(shí)代周刊》曾在1997年、2015年、2018年分別將克隆羊、VR、人工智能作為封面。但這三個(gè)都沒(méi)有真正成為用來(lái)命名那個(gè)時(shí)代的要素,原因是沒(méi)有真正切入到一個(gè)應(yīng)用來(lái)驅(qū)動(dòng)。
去年,《時(shí)代周刊》又將ChatGPT放在了封面上,和前面三次選擇不同的是,ChatGPT的核心不在于GPT這項(xiàng)技術(shù),而在于將GPT疊加到了Chat這項(xiàng)應(yīng)用上。GPT是一個(gè)2018年就已經(jīng)形成共識(shí)的技術(shù)。 所有技術(shù)真正意義上普及的關(guān)鍵,在于應(yīng)用的疊加。中國(guó)發(fā)展人工智能的最大機(jī)會(huì),正是在各種垂直行業(yè)的方向上,有著巨大的應(yīng)用疊加的空間和潛力。
過(guò)去幾年,商湯與福建省各地市保持長(zhǎng)期緊密合作,從城市治理到算力基礎(chǔ)設(shè)施服務(wù)、模型和生態(tài)層面進(jìn)行了多項(xiàng)布局。
商湯希望依托福州新區(qū)智算平臺(tái),推動(dòng)閩港合作及各地的生態(tài)協(xié)同,共同打造以應(yīng)用為驅(qū)動(dòng),以數(shù)據(jù)資產(chǎn)為要素的核心人工智能生態(tài)圈,繁榮AI產(chǎn)業(yè)發(fā)展。
-
AI
+關(guān)注
關(guān)注
88文章
35164瀏覽量
280055 -
人工智能
+關(guān)注
關(guān)注
1807文章
49029瀏覽量
249603 -
商湯科技
+關(guān)注
關(guān)注
8文章
564瀏覽量
36801
原文標(biāo)題:數(shù)字中國(guó)建設(shè)峰會(huì)丨商湯科技董事長(zhǎng)兼CEO徐立:新質(zhì)生產(chǎn)力下的大模型產(chǎn)業(yè)化
文章出處:【微信號(hào):SenseTime2017,微信公眾號(hào):商湯科技SenseTime】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
商湯大裝置實(shí)現(xiàn)大規(guī)模產(chǎn)業(yè)化應(yīng)用
無(wú)噴粉三維掃描在高反光場(chǎng)景的產(chǎn)業(yè)化實(shí)踐:激光偏振技術(shù)如何重塑精密測(cè)量

商湯科技與新華醫(yī)院聯(lián)合發(fā)布“AI兒童全科醫(yī)生”

研華工業(yè)AI Agent的發(fā)展態(tài)勢(shì)及實(shí)踐思考
云知聲與商湯科技達(dá)成戰(zhàn)略合作
安世半導(dǎo)體在全球化發(fā)展中的實(shí)踐經(jīng)驗(yàn)與前瞻思考
商湯科技日日新大模型SenseNova上線聲網(wǎng)云市場(chǎng)
格科GC7272榮獲第八屆“IC創(chuàng)新獎(jiǎng)”成果產(chǎn)業(yè)化獎(jiǎng)
商湯大裝置接入DeepSeek系列模型
商湯科技推出“日日新”融合大模型
紫光同芯亮相SAECCE 2024汽車芯片關(guān)鍵技術(shù)及產(chǎn)業(yè)化應(yīng)用論壇
商湯科技亮相第八屆中國(guó)品牌日活動(dòng)
固態(tài)電池產(chǎn)業(yè)化加速,企業(yè)積極布局市場(chǎng)
商湯日日新大模型中標(biāo)上海電信訂單
商湯絕影在行業(yè)率先實(shí)現(xiàn)原生多模態(tài)大模型的車端部署

評(píng)論