由AI大模型工場主辦的AI大模型生態(tài)暨算力大會在京舉行。作為國內(nèi)最具影響力與最懂大模型的AI生態(tài)大會,此次大會以「AI NATIVE,生成未來」為主題,圍繞大模型、算力、數(shù)據(jù)產(chǎn)業(yè)、基礎(chǔ)設(shè)施全產(chǎn)業(yè)鏈、應(yīng)用場景等多個維度展開深度剖析與對話。
云知聲 AI Labs 研發(fā)副總裁劉升平應(yīng)邀出席論壇并作主題演講,以《山海大模型的訓(xùn)練優(yōu)化方法及應(yīng)用實踐》為題,深入剖析大模型訓(xùn)練與優(yōu)化之道,并結(jié)合具體實踐案例,帶領(lǐng)與會人員進(jìn)一步了解大模型在多領(lǐng)域的落地應(yīng)用和創(chuàng)新成果。
山海持續(xù)進(jìn)化背后,大模型訓(xùn)練與優(yōu)化之道
云知聲是國家級專精特新“小巨人”企業(yè),2018年起連續(xù)六年上榜CB Insights全球人工智能獨角獸榜單;自2018年起連續(xù)5批參與承建6項國家重點研發(fā)計劃(“科技創(chuàng)新2030-新一代人工智能重大項目”),承擔(dān)北京科技計劃3項;先后獲得北京科技進(jìn)步獎一等獎、吳文俊人工智能科技進(jìn)步獎、福建省科技進(jìn)步獎一等獎等榮譽獎項。
作為國內(nèi)AGI技術(shù)產(chǎn)業(yè)化的先行者,云知聲于2023年5月發(fā)布山海大模型,其通用能力在權(quán)威測評機構(gòu)SuperCLUE發(fā)布的《中文大模型基準(zhǔn)測評2024上半年報告》中,以總分72的優(yōu)異成績穩(wěn)居全球大模型第一梯隊;其醫(yī)療能力登頂今年4月MedBench評測榜,在2023 PromptCBLUE醫(yī)療大模型評測獲通用賽道一等獎。
而山海之所以能夠持續(xù)在行業(yè)中保持領(lǐng)先地位,得益于團隊對技術(shù)創(chuàng)新的不懈追求和對產(chǎn)品性能的持續(xù)精進(jìn)與優(yōu)化。
現(xiàn)場,劉升平分享了山海大模型的通用訓(xùn)練策略,包含預(yù)訓(xùn)練、微調(diào)、偏好學(xué)習(xí)和自我提升四個步驟。同時,他指出,面向不同的行業(yè)、不同的企業(yè)、不同的應(yīng)用,需要提供相應(yīng)級別的大模型。基于此,云知聲提出了面向應(yīng)用場景的優(yōu)化方法包括提示工程、微調(diào)、檢索增強生成、對齊(反饋學(xué)習(xí))、Agent機制、增量預(yù)訓(xùn)練、可控解碼策略七種武器和一個秘方(數(shù)據(jù)訓(xùn)練的生產(chǎn)、選擇與配比),這些策略共同構(gòu)成了一套全面的方法論,確保了山海大模型能夠在實際應(yīng)用中達(dá)到最佳效果。
加速大模型落地,山海的實踐應(yīng)用探索
大模型是“成本”,應(yīng)用才是“價值”。劉升平指出,用戶不僅是為大模型付費,更是為其在實際場景中的應(yīng)用價值買單。
大模型的應(yīng)用五花八門,從大模型語言理解與生成能力的本源深究,其應(yīng)用場景可基于語言進(jìn)行分類。
自然語言
自然語言是人類在日常生活中使用的語言,可細(xì)分為口語和書面語:
面向口語,大模型有兩大應(yīng)用場景:一是人機對話系統(tǒng),大模型作為參與者與人類進(jìn)行對話,云知聲基于山海大模型打造的智慧座艙交互、智慧家居交互、智能客服與外呼等應(yīng)用均屬于這一范疇;二是人人對話系統(tǒng),大模型作為旁觀者,將人與人之間的對話錄音轉(zhuǎn)寫成文字,并進(jìn)行深入分析。例如,在會議記錄系統(tǒng)中,山海大模型能夠?qū)h中的口語對話實時轉(zhuǎn)錄并生成會議紀(jì)要;在門診病歷生成系統(tǒng)中,它能夠?qū)⑨t(yī)生與患者的對話轉(zhuǎn)錄并生成符合臨床規(guī)范的病歷。
面向書面語,大模型應(yīng)用可提供一個全面覆蓋文本生命周期的解決方案。從文本的創(chuàng)作到審核,再到問答、文本抽取與分析,大模型極大提升了文本處理的效率和質(zhì)量。云知聲藍(lán)藻AI內(nèi)容創(chuàng)作平臺和獸牙AI聚合平臺,就充分展示了山海大模型在文本智能化處理方面的強大能力。
形式語言
形式語言被設(shè)計用來執(zhí)行特定任務(wù),通常用于計算機科學(xué)與技術(shù)領(lǐng)域。這種語言具有嚴(yán)格的規(guī)則和結(jié)構(gòu),不允許有任何歧義或模糊性。例如,編程語言就是一種形式語言?;谛问秸Z言的特性開發(fā)的代碼智能系統(tǒng)通過自動化代碼生成,能夠幫助開發(fā)者減少手動編寫代碼的時間,同時確保代碼的質(zhì)量和安全性。
在選擇大模型應(yīng)用場景時,劉升平強調(diào),需要權(quán)衡大模型的成熟度以及對幻覺的容忍度,以確保選擇的場景能夠最大化大模型的優(yōu)勢,同時最小化潛在風(fēng)險。
-
AI
+關(guān)注
關(guān)注
88文章
35164瀏覽量
279923 -
云知聲
+關(guān)注
關(guān)注
0文章
234瀏覽量
8776 -
算力
+關(guān)注
關(guān)注
2文章
1201瀏覽量
15654 -
大模型
+關(guān)注
關(guān)注
2文章
3146瀏覽量
4070
原文標(biāo)題:云知聲出席AI大模型生態(tài)暨算力大會并作主題分享
文章出處:【微信號:云知聲,微信公眾號:云知聲】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
云知聲與商湯科技達(dá)成戰(zhàn)略合作
云知聲榮登甲子光年2025中國AI產(chǎn)業(yè)逐浪者榜單
云知聲再度登頂MedBench榜單
云知聲Atlas超算平臺的核心亮點
云知聲與英內(nèi)物聯(lián)簽署戰(zhàn)略合作協(xié)議 探索基于云知聲山海大模型的多元智慧場景

云知聲榮登2024大模型企業(yè)TOP50榜單
云知聲入選創(chuàng)業(yè)邦《2024 AIGC創(chuàng)新應(yīng)用洞察報告》
云知聲山海大模型多項能力全球領(lǐng)跑

云知聲與國信領(lǐng)英簽署戰(zhàn)略合作協(xié)議
云知聲山海多模態(tài)大模型UniGPT-mMed登頂MMMU測評榜首

評論