chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

云知聲山海大模型的創(chuàng)新應(yīng)用與實(shí)踐探索

云知聲 ? 來源:云知聲 ? 2024-09-19 15:45 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

每一次技術(shù)風(fēng)口,在掀起浪潮的同時(shí)也伴生著泡沫,盡管這輪GenAI革命無疑是一次深刻改變?nèi)祟愇拿鬟M(jìn)程的革命,但過去一年,關(guān)于AI, 有太多荒謬不實(shí)、不負(fù)責(zé)任的雜音,也有太多為技術(shù)而技術(shù)的錯(cuò)誤應(yīng)用范式。

近日,昆侖巢聯(lián)合各路AI領(lǐng)域大咖和組織機(jī)構(gòu),舉辦首期人工智能應(yīng)用實(shí)踐討論專場(chǎng),打造了一場(chǎng)圍繞AI應(yīng)用的線上思辨對(duì)談,旨在促進(jìn)AI行業(yè)的深入思考和建設(shè)性對(duì)話。云知聲算法研發(fā)總監(jiān)王亦寧應(yīng)邀出席活動(dòng)并帶來主題為《基于山海大模型的領(lǐng)域級(jí)RAG技術(shù)探索及其實(shí)踐》的深度演講。

現(xiàn)場(chǎng),王亦寧結(jié)合其在人工智能領(lǐng)域的豐富經(jīng)驗(yàn),深入剖析了RAG技術(shù)在大模型中的關(guān)鍵作用,并基于山海大模型的構(gòu)建與實(shí)際落地探索,分享了山海大模型的企業(yè)級(jí)優(yōu)化策略,為與會(huì)者提供了實(shí)現(xiàn)技術(shù)深度融合與價(jià)值最大化的前瞻性洞見。

以下為分享精華,我們做了整理,謹(jǐn)供學(xué)習(xí):

PART 1

RAG:山海大模型的創(chuàng)新應(yīng)用與實(shí)踐探索

當(dāng)前,大語言模型應(yīng)用主要面臨私有部署難、幻覺問題、安全合規(guī)以及知識(shí)更新局限性等問題。正是在這樣的背景下,檢索增強(qiáng)生成技術(shù)(Retrieval-Augmented Generation,RAG)應(yīng)時(shí)而生,成為大模型時(shí)代的一大趨勢(shì)。

RAG是指檢索增強(qiáng)生成(Retrieval Augmented Generation )技術(shù),其在大語言模型生成答案之前,先從廣泛的文檔數(shù)據(jù)庫中檢索相關(guān)信息,然后利用這些信息來引導(dǎo)生成過程,極大地提升了內(nèi)容的準(zhǔn)確性和相關(guān)性。

盡管RAG技術(shù)在提升語言模型的復(fù)雜查詢處理能力方面具有顯著優(yōu)勢(shì),但在實(shí)際應(yīng)用中仍面臨一些關(guān)鍵挑戰(zhàn)。這些挑戰(zhàn)包括保持語義連貫性、過濾無關(guān)信息、處理口語化表達(dá)、避免生成錯(cuò)誤信息以及減少干擾等。王亦寧強(qiáng)調(diào),解決這些問題對(duì)于提升RAG性能和應(yīng)用范圍至關(guān)重要。

會(huì)上,王亦寧向與會(huì)觀眾展示了RAG技術(shù)如何與大模型結(jié)合,以強(qiáng)化其在特定領(lǐng)域的應(yīng)用效能。具體來說,首先通過口語改寫和Query優(yōu)化,精確捕捉用戶意圖。隨后,利用向量化技術(shù)在向量數(shù)據(jù)庫中高效檢索相關(guān)信息,并通過多路召回策略全面搜集數(shù)據(jù),過濾噪聲。在生成階段,采用關(guān)鍵信息抽取和Prompt工程技術(shù),確?;卮鸬臏?zhǔn)確性和相關(guān)性,避免錯(cuò)誤信息的產(chǎn)生。最后,嚴(yán)格的問答校驗(yàn)流程,保證了輸出回答的高質(zhì)量,確保為用戶提供更可靠的內(nèi)容。

整體而言,RAG技術(shù)的應(yīng)用,幫助山海大模型打造了一個(gè)高效、準(zhǔn)確的問答系統(tǒng),有效緩解了幻覺問題,提高了知識(shí)更新的速度,并增強(qiáng)了內(nèi)容生成的可追溯性,使得大語言模型在實(shí)際應(yīng)用中變得更加實(shí)用和可信。

為了具體展示RAG在山海大模型中的應(yīng)用,王亦寧以工業(yè)問答為例,向與會(huì)嘉賓生動(dòng)展示了如何利用山海模型進(jìn)行高效的Query Answer Retrieval。通過基于Copy機(jī)制的RAG、Query改寫、檢索精排、候選結(jié)果過濾、關(guān)鍵信息抽取和片段校驗(yàn)等技術(shù),山海RAG技術(shù)方案在增強(qiáng)大模型回答質(zhì)量的同時(shí),更確保了在不確定性情況下的可靠性,使得大模型在特定領(lǐng)域的應(yīng)用更加精準(zhǔn)、高效和可信。

PART 2

打造企業(yè)級(jí)應(yīng)用范式,山海的六大優(yōu)化實(shí)踐路徑

演講后半段,王亦寧分享了山海大模型在企業(yè)級(jí)應(yīng)用中的優(yōu)化實(shí)踐,包含預(yù)訓(xùn)練、指令微調(diào)、對(duì)齊、Agent、解碼策略、提示工程六大策略。

預(yù)訓(xùn)練:

利用行業(yè)特定的語料庫對(duì)模型進(jìn)行進(jìn)一步的預(yù)訓(xùn)練,使其能夠更好地理解和適應(yīng)特定行業(yè)的術(shù)語、概念和上下文。在醫(yī)療行業(yè)語料庫的加持下,山海大模型于2023年6月的MedQA任務(wù)中超越Med-PaLM 2,取得87.1%的優(yōu)異成績;在臨床執(zhí)業(yè)醫(yī)師資格考試中提升至523(總分600分),超過99%的考生水平。

指令微調(diào):

在企業(yè)級(jí)應(yīng)用中,云知聲采用了一系列微調(diào)策略以提升其大模型的性能——全量SFT通過大規(guī)模標(biāo)注數(shù)據(jù)集對(duì)模型進(jìn)行全面訓(xùn)練,以確保模型在特定任務(wù)上達(dá)到最優(yōu)表現(xiàn);LoRA和QLoRA技術(shù)通過引入低秩結(jié)構(gòu)和量化方法,高效調(diào)整模型參數(shù),使模型能夠快速適應(yīng)新任務(wù),同時(shí)降低資源消耗;P-Tuning策略則專注于優(yōu)化模型的特定部分,以增強(qiáng)模型對(duì)新數(shù)據(jù)的適應(yīng)性;Adaptor技術(shù)通過在模型主體之外添加小型適配器網(wǎng)絡(luò),使模型能夠在保持原有結(jié)構(gòu)的同時(shí),學(xué)習(xí)并適應(yīng)新任務(wù)的特征。這些策略的綜合應(yīng)用,使得山海大模型在保持預(yù)訓(xùn)練優(yōu)勢(shì)的基礎(chǔ)上,能夠精準(zhǔn)滿足企業(yè)級(jí)應(yīng)用的多樣化需求。

對(duì)齊:

為確保大模型的輸出與用戶需求和偏好保持一致,云知聲在大模型的企業(yè)級(jí)優(yōu)化過程中采用了RLHF、RLAIF、DPO三大對(duì)齊策略——RLHF通過分析用戶的直接反饋,使用強(qiáng)化學(xué)習(xí)來優(yōu)化模型行為,使其生成的答復(fù)更加精準(zhǔn)和符合期望;RLAIF進(jìn)一步通過逆向獎(jiǎng)勵(lì)機(jī)制增強(qiáng)模型的學(xué)習(xí)能力,鼓勵(lì)生成高質(zhì)量答案并避免不相關(guān)輸出;DPO則直接針對(duì)用戶偏好進(jìn)行優(yōu)化,通過比較不同輸出樣本來提升模型輸出的滿意度。這些策略的結(jié)合不僅提升了模型的響應(yīng)質(zhì)量,還增強(qiáng)了模型適應(yīng)不同用戶需求的能力,從而在企業(yè)級(jí)應(yīng)用中實(shí)現(xiàn)更加個(gè)性化和更高效的服務(wù)。

Agent:

山海大模型通過一系列Agent創(chuàng)新策略,顯著提升了企業(yè)級(jí)應(yīng)用的效能。Web搜索增強(qiáng)賦予了Agent實(shí)時(shí)訪問互聯(lián)網(wǎng)信息的能力,確保答復(fù)的時(shí)效性和準(zhǔn)確性;外部檢索增強(qiáng)則讓Agent深入挖掘企業(yè)內(nèi)部知識(shí)庫,提供專業(yè)且深入的答復(fù);ToolLLM進(jìn)一步擴(kuò)展了Agent的功能,集成了多種輔助工具,使得語言模型能夠執(zhí)行更復(fù)雜的任務(wù)。

解碼策略:

解碼策略是優(yōu)化語言模型輸出的關(guān)鍵環(huán)節(jié),涉及多種技術(shù)以適應(yīng)不同的應(yīng)用需求。Greedy Search以其簡潔性快速選擇最可能的詞,而Beam Search通過考慮多個(gè)最可能的序列來增加找到最優(yōu)解的幾率。Top-k采樣通過限制詞的選擇范圍來平衡結(jié)果的多樣性和準(zhǔn)確性。Copy Mechanism允許模型復(fù)制輸入中的短語,以提高回答的準(zhǔn)確性。Restricted Decoding確保輸出內(nèi)容的適當(dāng)性,而推測(cè)性解碼Speculative Decoding允許模型生成基于假設(shè)的答案,適用于需要?jiǎng)?chuàng)造性的場(chǎng)景。這些策略的綜合應(yīng)用,使得語言模型能夠靈活地處理各種復(fù)雜的查詢,提供高質(zhì)量、多樣化且符合用戶需求的回答。

提示工程:

提示工程提升了模型對(duì)任務(wù)的理解和生成文本的準(zhǔn)確性,是提高語言模型在各種應(yīng)用場(chǎng)景中表現(xiàn)的關(guān)鍵。它包括利用上下文學(xué)習(xí)(In-context Learning)為模型提供豐富的背景信息,使其能夠基于少量示例快速適應(yīng)新任務(wù);構(gòu)建思維鏈(Chain of Thought)和思維樹(Thought Trees)以模擬逐步的邏輯推理過程,增強(qiáng)模型解決復(fù)雜問題的能力;以及確保自我一致性(Self-consistency),使模型輸出在邏輯上連貫無矛盾。

此外,云知聲UniDataOps框架通過其綜合性的數(shù)據(jù)處理能力,為大型語言模型的訓(xùn)練和微調(diào)提供了一個(gè)強(qiáng)大、可靠的數(shù)據(jù)基礎(chǔ),從而顯著提升企業(yè)級(jí)大模型應(yīng)用的性能和效果。

演講的尾聲,王亦寧對(duì)未來人工智能技術(shù)的發(fā)展前景表達(dá)了積極樂觀的態(tài)度,他表示,云知聲期望通過深化對(duì)復(fù)雜文本數(shù)據(jù)的分析和格式處理,提升對(duì)視覺信息的解讀能力,并實(shí)現(xiàn)基于圖像的內(nèi)容問答功能,從而拓展AI在多模態(tài)交互和智能理解方面的可能性,為用戶帶來更加多樣化和個(gè)性化的應(yīng)用體驗(yàn)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    89

    文章

    38015

    瀏覽量

    296011
  • 人工智能
    +關(guān)注

    關(guān)注

    1813

    文章

    49711

    瀏覽量

    261248
  • 云知聲
    +關(guān)注

    關(guān)注

    0

    文章

    279

    瀏覽量

    9068

原文標(biāo)題:云知聲出席昆侖巢首期人工智能應(yīng)用實(shí)踐討論專場(chǎng)并作主題分享

文章出處:【微信號(hào):云知聲,微信公眾號(hào):云知聲】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    入選廈門市第五批中小學(xué)生研學(xué)實(shí)踐教育基地

    近日,廈門市教育局公布第五批中小學(xué)生研學(xué)實(shí)踐教育基地名單,東南總部——廈門芯智能科技有
    的頭像 發(fā)表于 11-13 17:50 ?1149次閱讀

    多項(xiàng)業(yè)務(wù)營收大漲

    依托山海模型,不斷開拓陣地,開發(fā)了面向東盟等海外市場(chǎng)和國內(nèi)方言市場(chǎng)的語音大模型,
    的頭像 發(fā)表于 09-10 15:44 ?444次閱讀

    東南總部入選廈門市集美區(qū)首批實(shí)習(xí)實(shí)訓(xùn)基地

    近日,廈門市集美區(qū)人力資源和社會(huì)保障局正式認(rèn)定并公布了首批實(shí)習(xí)實(shí)訓(xùn)基地名單,東南總部——廈門芯智能科技有限公司,憑借在人工智能領(lǐng)域
    的頭像 發(fā)表于 07-09 11:37 ?770次閱讀

    在港交所成功上市

    近日,智能科技股份有限公司(以下簡稱“”)于香港聯(lián)合交易所主板掛牌上市,股份代號(hào):0
    的頭像 發(fā)表于 07-03 17:41 ?880次閱讀

    AGI龍頭企業(yè)港股上市,市值達(dá)147億港元

    為147.44億港元。 ? 圖:創(chuàng)始人董事長CEO黃偉博士在現(xiàn)場(chǎng)致辭表示:從今天起,我們將以香港為支點(diǎn),將中國AGI產(chǎn)品帶向全世界——用更敏捷的創(chuàng)新、更好的商業(yè)化和更開放的心胸,
    的頭像 發(fā)表于 06-30 11:44 ?2549次閱讀
    AGI龍頭企業(yè)<b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>聲</b>港股上市,市值達(dá)147億港元

    與商湯科技達(dá)成戰(zhàn)略合作

    近日,智能科技股份有限公司(以下簡稱“”)與上海商湯智能科技有限公司(以下簡稱“商湯
    的頭像 發(fā)表于 06-20 14:52 ?788次閱讀

    榮登甲子光年2025中國AI產(chǎn)業(yè)逐浪者榜單

    近日,由甲子光年主辦的「AI共潮生·2025甲子引力X科技產(chǎn)業(yè)新風(fēng)向」在上海工業(yè)智能中心成功舉辦。憑借山海模型的領(lǐng)先技術(shù)實(shí)力與多領(lǐng)域
    的頭像 發(fā)表于 05-26 14:13 ?608次閱讀

    再度登頂MedBench榜單

    近日,中文醫(yī)療大模型權(quán)威評(píng)測(cè)平臺(tái)MedBench公布最新自測(cè)榜單結(jié)果,基于山海模型打造的
    的頭像 發(fā)表于 05-20 10:12 ?631次閱讀

    入選工信部2024年未來產(chǎn)業(yè)創(chuàng)新發(fā)展優(yōu)秀典型案例

    近日,工業(yè)和信息化部高新技術(shù)司發(fā)布《2024年未來產(chǎn)業(yè)創(chuàng)新發(fā)展優(yōu)秀典型案例公示》,"基于大模型和語音交互技術(shù)的醫(yī)療文書自動(dòng)生成系統(tǒng)"成
    的頭像 發(fā)表于 03-31 16:48 ?814次閱讀

    Atlas超算平臺(tái)的核心亮點(diǎn)

    ”,榮耀入選《分布式統(tǒng)一大數(shù)據(jù)虛擬文件系統(tǒng)Alluxio原理、技術(shù)與實(shí)踐》。這一榮譽(yù)不僅彰顯了在技術(shù)創(chuàng)新方面的實(shí)力,也充分肯定了其在A
    的頭像 發(fā)表于 01-07 16:08 ?932次閱讀

    榮耀斬獲四項(xiàng)年度大獎(jiǎng)

    歲末年初,不僅是時(shí)間流轉(zhuǎn)的標(biāo)志,更是萬物更新、夢(mèng)想揚(yáng)帆的新篇章。在這個(gè)交織著希望與挑戰(zhàn)的關(guān)鍵時(shí)刻,憑借其在人工智能領(lǐng)域的卓越成就和深厚技術(shù)積淀,榮耀斬獲四項(xiàng)年度大獎(jiǎng)。這不僅是對(duì)
    的頭像 發(fā)表于 01-07 16:06 ?751次閱讀

    與南京藝術(shù)學(xué)院簽署戰(zhàn)略合作協(xié)議

    近日,南京市鼓樓區(qū)高校院所黨建聯(lián)席會(huì)暨協(xié)同創(chuàng)新發(fā)展聯(lián)盟會(huì)議在鼓樓區(qū)隆重召開。會(huì)上,智能科技股份有限公司(以下簡稱“
    的頭像 發(fā)表于 12-24 10:28 ?735次閱讀

    近期斬獲多項(xiàng)年度大獎(jiǎng)

    在科技迅猛發(fā)展的當(dāng)下,人工智能(AI)已成為推動(dòng)各行業(yè)革新的核心動(dòng)力。,以其卓越的技術(shù)實(shí)力和敏銳的市場(chǎng)洞察,在AI領(lǐng)域中脫穎而出,成為行業(yè)的領(lǐng)航者。近日,
    的頭像 發(fā)表于 12-24 10:26 ?790次閱讀

    斬獲2024高工智能汽車金球獎(jiǎng)

    12月10日-12日,2024(第八屆)高工智能汽車年會(huì)暨年度金球獎(jiǎng)評(píng)選頒獎(jiǎng)典禮在上海舉行。端側(cè)大模型解決方案憑借卓越的技術(shù)創(chuàng)新與出色
    的頭像 發(fā)表于 12-12 18:30 ?974次閱讀

    與英內(nèi)物聯(lián)簽署戰(zhàn)略合作協(xié)議 探索基于山海模型的多元智慧場(chǎng)景

    ?? 12月6日,(上海)智能科技有限公司(以下簡稱““)與上海英內(nèi)物聯(lián)網(wǎng)科技股份有
    的頭像 發(fā)表于 12-06 20:05 ?1512次閱讀
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>聲</b>與英內(nèi)物聯(lián)簽署戰(zhàn)略合作協(xié)議 <b class='flag-5'>探索</b>基于<b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>聲</b><b class='flag-5'>山海</b>大<b class='flag-5'>模型</b>的多元智慧場(chǎng)景