“通用能力突出,專用場景全面,應(yīng)用成熟度優(yōu)秀”。
近日,商湯小浣熊代碼大模型在中國信通院“可信AI代碼大模型評估”中,榮獲4+級最高評級,成為國內(nèi)首批通過該項評估的企業(yè)之一。
商湯小浣熊在代碼通用能力、專用場景和應(yīng)用成熟度等多個評估維度中表現(xiàn)優(yōu)秀。

依據(jù)中國信通院《智能化軟件工程技術(shù)和應(yīng)用要求 第1部分:代碼大模型》,此次評估聚焦大模型的通用能力、專用場景能力和應(yīng)用成熟度三大部分,包括16個能力項、100多個能力要求,從輸入多樣性、任務(wù)多樣性、語言完備度、結(jié)果可接收性、結(jié)果準(zhǔn)確度等維度,考核代碼大模型的全棧技術(shù)能力。

圖片來源:中國信通院
商湯小浣熊作為首批參評企業(yè)獲得4+級評級,是本次評分最高的代碼大模型之一。中國信通院測評結(jié)果顯示:
通用能力方面,小浣熊在代碼解釋、代碼轉(zhuǎn)換等方面表現(xiàn)突出;
專用場景方面,小浣熊支持網(wǎng)站開發(fā)、桌面應(yīng)用開發(fā)、移動應(yīng)用開發(fā)、數(shù)據(jù)庫開發(fā)等多個場景的開發(fā)能力;
應(yīng)用成熟度方面,小浣熊在數(shù)據(jù)分類分級、模型性能、模型服務(wù)可維護(hù)性、風(fēng)險可控性等方面均表現(xiàn)優(yōu)秀。
「小浣熊家族」是基于商湯“日日新SenseNova”大模型體系打造的 AI Native 生產(chǎn)力系列工具,覆蓋軟件開發(fā)、數(shù)據(jù)分析、編程教育等多個場景,旨在通過先進(jìn)的人工智能技術(shù)優(yōu)化和提升工作效率?,F(xiàn)已推出代碼小浣熊和辦公小浣熊兩位產(chǎn)品成員。
代碼小浣熊是基于大模型的軟件智能研發(fā)助手,覆蓋軟件需求分析、架構(gòu)設(shè)計、代碼編寫、軟件測試等環(huán)節(jié),滿足用戶代碼編寫、編程學(xué)習(xí)等各類需求,現(xiàn)已支持Python、Java、JavaScript、C++、Go、SQL等90+主流編程語言和VS Code、JetBrains全家桶、Android Studio等主流IDE。
辦公小浣熊是基于大模型的大模型原生數(shù)據(jù)分析產(chǎn)品,可以通過用戶的自然語言輸入,自動將數(shù)據(jù)轉(zhuǎn)化為有意義的分析和可視化結(jié)果。
小浣熊家族背后的「小浣熊代碼大模型」,在權(quán)威測試集HumanEval Coding測試中一次通過率達(dá)到78.1%,在數(shù)據(jù)分析場景下的數(shù)據(jù)測試集(1000+題目)中以85.71%的正確率超過GPT-4。
自上線以來,小浣熊代碼大模型累計為10萬+個人用戶提供服務(wù),單日代碼生成數(shù)量達(dá)到10億+Tokens,總體平均代碼采納率超過30%,用戶編碼能效提升達(dá)到20%~78%。
目前,商湯小浣熊代碼大模型已經(jīng)被包括金融、新能源汽車等行業(yè)在內(nèi)的200+企業(yè)客戶使用,憑借突出的數(shù)理能力覆蓋多元落地場景。
例如,在與金山辦公的合作中,小浣熊代碼大模型助力WPS 365打造更高效釋放場景能力的智能辦公平臺,為用戶多元、碎片化的辦公需求提供新質(zhì)生產(chǎn)力。
此外,基于小浣熊代碼大模型,商湯科技與海通證券合作打造智能研發(fā)助手,輔助金融企業(yè)研發(fā)人員進(jìn)行代碼編程,為開發(fā)者提供代碼智能補全與對話問答服務(wù),可輔助生產(chǎn)約20%代碼,降低開發(fā)技術(shù)門檻,有效提高開發(fā)效率。
未來,商湯小浣熊將持續(xù)降低大模型技術(shù)的開發(fā)和應(yīng)用門檻,賦能更多場景創(chuàng)新。
-
代碼
+關(guān)注
關(guān)注
30文章
4968瀏覽量
74014 -
商湯
+關(guān)注
關(guān)注
0文章
91瀏覽量
4366 -
大模型
+關(guān)注
關(guān)注
2文章
3653瀏覽量
5196
原文標(biāo)題:首批通過,最高評級,商湯小浣熊喜提中國信通院代碼大模型能力評估“三好生”
文章出處:【微信號:SenseTime2017,微信公眾號:商湯科技SenseTime】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
商湯大裝置SenseCore原生AI云平臺榮獲軟件供應(yīng)鏈安全能力評估認(rèn)證
商湯大裝置SenseCore原生AI云平臺榮獲信通院5A卓越級認(rèn)證
曙光云榮獲中國信通院2025數(shù)字政府建設(shè)突出貢獻(xiàn)單位獎
商湯科技正式發(fā)布AI辦公智能體小浣熊3.0
華為獲得中國信通院最高評級證書
商湯辦公小浣熊與銀河麒麟操作系統(tǒng)V11完成適配
中國中車通過中國信通院可信AI人工智能數(shù)據(jù)集質(zhì)量四級評估
燧原科技國產(chǎn)萬卡集群通過中國信通院權(quán)威認(rèn)證
大華問數(shù)智能體一體機(jī)通過中國信通院權(quán)威評測認(rèn)證
商湯大裝置萬象大模型開發(fā)平臺獲得中國信通院最高評級
商湯日日新SenseNova融合模態(tài)大模型 國內(nèi)首家獲得最高評級的大模型
商湯科技“小浣熊家族”與螞蟻集團(tuán)旗下智能體開發(fā)平臺“螞蟻百寶箱”正式達(dá)成生態(tài)合作
商湯小浣熊家族全面入駐聯(lián)想生態(tài)全平臺
百度文心大模型X1 Turbo獲得信通院當(dāng)前大模型最高評級證書
商湯小浣熊榮獲中國信通院代碼大模型能力評估“三好生”
評論