chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

藏經(jīng)閣計(jì)劃發(fā)布一年以來(lái),阿里知識(shí)圖譜團(tuán)隊(duì)有哪些技術(shù)突破?

mK5P_AItists ? 來(lái)源:YXQ ? 2019-04-17 09:31 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

摘要:2018年4月阿里巴巴業(yè)務(wù)平臺(tái)事業(yè)部——知識(shí)圖譜團(tuán)隊(duì)聯(lián)合清華大學(xué)、浙江大學(xué)、中科院自動(dòng)化所、中科院軟件所、蘇州大學(xué)等五家機(jī)構(gòu),聯(lián)合發(fā)布藏經(jīng)閣(知識(shí)引擎)研究計(jì)劃。藏經(jīng)閣計(jì)劃依賴阿里強(qiáng)大的計(jì)算能力(例如Igraph圖數(shù)據(jù)庫(kù)),和先進(jìn)的機(jī)器學(xué)習(xí)算法(例如PAI平臺(tái))。計(jì)劃發(fā)布一年以來(lái),阿里知識(shí)圖譜團(tuán)隊(duì)有哪些技術(shù)突破?今天一起來(lái)了解。

背景

藏經(jīng)閣計(jì)劃發(fā)布一年以來(lái),我們對(duì)知識(shí)引擎技術(shù)進(jìn)行了重新定義,將其定義成五大技術(shù)模塊:知識(shí)獲取、知識(shí)建模、知識(shí)推理、知識(shí)融合、知識(shí)服務(wù),并將其開(kāi)發(fā)落地。

其中知識(shí)建模的任務(wù)是定義通用/特定領(lǐng)域知識(shí)描述的概念、事件、規(guī)則及其相互關(guān)系的知識(shí)表示方法,建立通用/特定領(lǐng)域知識(shí)圖譜的概念模型;知識(shí)獲取是對(duì)知識(shí)建模定義的知識(shí)要素進(jìn)行實(shí)例化的獲取過(guò)程,將非結(jié)構(gòu)化數(shù)據(jù)結(jié)構(gòu)化為圖譜里的知識(shí);而知識(shí)融合是對(duì)異構(gòu)和碎片化知識(shí)進(jìn)行語(yǔ)義集成的過(guò)程,通過(guò)發(fā)現(xiàn)碎片化以及異構(gòu)知識(shí)之間的關(guān)聯(lián),獲得更完整的知識(shí)描述和知識(shí)之間的關(guān)聯(lián)關(guān)系,實(shí)現(xiàn)知識(shí)互補(bǔ)和融合;知識(shí)推理是根據(jù)知識(shí)圖譜提供知識(shí)計(jì)算和推理模型,發(fā)現(xiàn)知識(shí)圖譜中的相關(guān)知識(shí)和隱含知識(shí)的過(guò)程。知識(shí)服務(wù)則是通過(guò)構(gòu)建好的知識(shí)圖譜提供以知識(shí)為核心的知識(shí)智能服務(wù),提升應(yīng)用系統(tǒng)的智能化服務(wù)能力。

圖1 藏經(jīng)閣-知識(shí)引擎產(chǎn)品

經(jīng)過(guò)一年的工作,在知識(shí)建模模塊我們開(kāi)發(fā)了Ontology自動(dòng)搭建、屬性自動(dòng)發(fā)現(xiàn)等算法,搭建了知識(shí)圖譜Ontology構(gòu)建的工具;在知識(shí)獲取模塊我們研發(fā)了新實(shí)體識(shí)別、緊湊型事件識(shí)別,關(guān)系抽取等算法,達(dá)到了業(yè)界最高水平;在知識(shí)融合模塊,我們?cè)O(shè)計(jì)了實(shí)體對(duì)齊和屬性對(duì)齊的深度學(xué)習(xí)算法,使之可以在不同知識(shí)庫(kù)上達(dá)到更好的擴(kuò)展性,大大豐富了知識(shí)圖譜里的知識(shí);在知識(shí)推理模塊,我們提出了基于Character Embedding的知識(shí)圖譜表示學(xué)習(xí)模型CharTransE、可解釋的知識(shí)圖譜學(xué)習(xí)表示模型XTransE,并開(kāi)發(fā)出了強(qiáng)大的推理引擎。

基于上面的這些技術(shù)模塊,我們開(kāi)發(fā)了通用的知識(shí)引擎產(chǎn)品,目前已經(jīng)在全阿里經(jīng)濟(jì)體的淘寶、天貓、盒馬鮮生、飛豬、天貓精靈等幾十種產(chǎn)品上取得了成功應(yīng)用,每天有8000多萬(wàn)次在線調(diào)用,日均離線輸出9億條知識(shí)。目前在知識(shí)引擎產(chǎn)品上,已經(jīng)構(gòu)建成功并運(yùn)行著商品、旅游、新制造等5個(gè)垂直領(lǐng)域圖譜的服務(wù)。

圖2 知識(shí)引擎四個(gè)層次圖示

在每個(gè)模塊的構(gòu)建過(guò)程中,我們陸續(xù)攻克了一系列的技術(shù)問(wèn)題。本文將選取其中的兩項(xiàng)工作來(lái)介紹給大家:

1、在眾包數(shù)據(jù)上進(jìn)行對(duì)抗學(xué)習(xí)的命名實(shí)體識(shí)別方法

知識(shí)獲取模塊包含實(shí)體識(shí)別、實(shí)體鏈接、新實(shí)體發(fā)現(xiàn)、關(guān)系抽取、事件挖掘等基本任務(wù),而實(shí)體識(shí)別(NER)又是其中最核心的任務(wù)。

目前學(xué)術(shù)界最好的命名實(shí)體識(shí)別算法主要是基于有監(jiān)督學(xué)習(xí)的。構(gòu)建高性能NER系統(tǒng)的關(guān)鍵是獲取高質(zhì)量標(biāo)注語(yǔ)料。但是高質(zhì)量標(biāo)注數(shù)據(jù)通常需要專家進(jìn)行標(biāo)注,代價(jià)高并且速度較慢,因此目前工業(yè)界比較流行的方案是依賴眾包來(lái)標(biāo)注數(shù)據(jù),但是由于眾包人員素質(zhì)參差不齊,對(duì)問(wèn)題理解也千差萬(wàn)別,所以用其訓(xùn)練的算法效果會(huì)受到影響?;诖藛?wèn)題,我們提出了針對(duì)眾包標(biāo)注數(shù)據(jù),設(shè)計(jì)對(duì)抗網(wǎng)絡(luò)來(lái)學(xué)習(xí)眾包標(biāo)注員之間的共性,消除噪音,提高中文NER的性能的方法。

這項(xiàng)工作的具體網(wǎng)絡(luò)框架如圖3所示:

圖3基于對(duì)抗網(wǎng)絡(luò)的實(shí)體識(shí)別模型

標(biāo)注員ID:對(duì)于各個(gè)標(biāo)注員ID信息,我們使用一個(gè)Looking-up表,表內(nèi)存儲(chǔ)著每個(gè)WorkerID的向量表示。向量的初始值通過(guò)隨機(jī)數(shù)進(jìn)行初始化。在模型訓(xùn)練過(guò)程中,ID向量的所有數(shù)值作為模型的參數(shù),在迭代過(guò)程中隨同其他參數(shù)一起優(yōu)化。在訓(xùn)練時(shí)每個(gè)標(biāo)注樣例的標(biāo)注員,我們直接通過(guò)查表獲取對(duì)應(yīng)的ID向量表示。在測(cè)試時(shí),由于缺乏標(biāo)注員信息,我們使用所有向量的平均值作為ID向量輸入。

對(duì)抗學(xué)習(xí)(WorkerAdversarial):眾包數(shù)據(jù)作為訓(xùn)練語(yǔ)料,存在一定數(shù)量的標(biāo)注錯(cuò)誤,即“噪音”。這些標(biāo)注不當(dāng)或標(biāo)注錯(cuò)誤都是由標(biāo)注員帶來(lái)的。不同標(biāo)注員對(duì)于規(guī)范的理解和背景認(rèn)識(shí)是不同的。對(duì)抗學(xué)習(xí)的各LSTM模塊如下:

私有信息的LSTM稱為“private”,它的學(xué)習(xí)目標(biāo)是擬合各位標(biāo)注員的獨(dú)立分布;而共有信息的LSTM稱為“common”,它的輸入是句子,它的作用是學(xué)習(xí)標(biāo)注結(jié)果之間的共有特征,

標(biāo)注信息的LSTM稱為“l(fā)abel”,以訓(xùn)練樣例的標(biāo)注結(jié)果序列為輸入,

。

再通過(guò)標(biāo)注員分類器把label和common的LSTM特征合并,輸入給CNN層進(jìn)行特征組合提取,最終對(duì)標(biāo)注員進(jìn)行分類。要注意的是,我們希望標(biāo)注員分類器最終失去判斷能力,也就是學(xué)習(xí)到特征對(duì)標(biāo)注員沒(méi)有區(qū)分能力,也就是共性特征。所以在訓(xùn)練參數(shù)優(yōu)化時(shí),它要反向更新。

在實(shí)際的實(shí)體識(shí)別任務(wù)中,我們把common和private的LSTM特征和標(biāo)注員ID向量合并,作為實(shí)體標(biāo)注部分的輸入,最后用CRF層解碼完成標(biāo)注任務(wù)。

實(shí)驗(yàn)結(jié)果如圖4所示,我們的算法在商品Title和用戶搜索Query的兩個(gè)數(shù)據(jù)集上均取得最好的性能:

圖4基于對(duì)抗網(wǎng)絡(luò)的實(shí)體識(shí)別模型實(shí)驗(yàn)結(jié)果

2、基于規(guī)則與graph embedding迭代學(xué)習(xí)的知識(shí)圖譜推理算法

知識(shí)圖譜推理計(jì)算是補(bǔ)充和校驗(yàn)圖譜關(guān)系及屬性的必不可少的技術(shù)手段。規(guī)則和嵌入(Embedding)是兩種不同的知識(shí)圖譜推理的方式,并各有優(yōu)劣,規(guī)則本身精確且人可理解,但大部分規(guī)則學(xué)習(xí)方法在大規(guī)模知識(shí)圖譜上面臨效率問(wèn)題,而嵌入(Embedding)表示本身具有很強(qiáng)的特征捕捉能力,也能夠應(yīng)用到大規(guī)模復(fù)雜的知識(shí)圖譜上,但好的嵌入表示依賴于訓(xùn)練信息的豐富程度,所以對(duì)稀疏的實(shí)體很難學(xué)到很好的嵌入表示。我們提出了一種迭代學(xué)習(xí)規(guī)則和嵌入的思路,在這項(xiàng)工作中我們利用表示學(xué)習(xí)來(lái)學(xué)習(xí)規(guī)則,并利用規(guī)則對(duì)稀疏的實(shí)體進(jìn)行潛在三元組的預(yù)測(cè),并將預(yù)測(cè)的三元組添加到嵌入表示的學(xué)習(xí)過(guò)程中,然后不斷進(jìn)行迭代學(xué)習(xí)。工作的整體框架如圖5所示:

圖5基于對(duì)抗網(wǎng)絡(luò)的實(shí)體識(shí)別模型實(shí)驗(yàn)結(jié)果

嵌入學(xué)習(xí)優(yōu)化的目標(biāo)函數(shù)是:

其中:

lsro表示三元組的標(biāo)記,表示三元組的評(píng)分函數(shù),vs表示圖譜三元組中主語(yǔ)(subject)的映射,Mr表示圖譜中兩個(gè)實(shí)體間關(guān)系的映射,vo表示圖譜三元組中賓語(yǔ)(object)的映射。

基于學(xué)習(xí)到的規(guī)則(axiom),就可以進(jìn)行推理執(zhí)行了。通過(guò)一種迭代策略,先使用嵌入(Embedding)的方法從圖譜中學(xué)習(xí)到規(guī)則,再將規(guī)則推理執(zhí)行,將新增的關(guān)系再加入到圖譜中,通過(guò)這種不斷學(xué)習(xí)迭代的算法,能夠?qū)D譜中的關(guān)系預(yù)測(cè)做的越來(lái)越準(zhǔn)。最終我們的算法取得了非常優(yōu)秀的性能:

除了上述兩項(xiàng)工作以外,在知識(shí)引擎技術(shù)的研發(fā)上我們還有一系列的前沿工作,取得了領(lǐng)先業(yè)界的效果,研究成果發(fā)表在AAAI、WWW、EMNLP、WSDM等會(huì)議上。

之后阿里巴巴知識(shí)圖譜團(tuán)隊(duì)會(huì)持續(xù)推進(jìn)藏經(jīng)閣計(jì)劃,構(gòu)建通用可遷移的知識(shí)圖譜算法,并將知識(shí)圖譜里的數(shù)據(jù)輸出到阿里巴巴內(nèi)外部的各項(xiàng)應(yīng)用之中,為這些應(yīng)用插上AI的翅膀,成為阿里巴巴經(jīng)濟(jì)體乃至全社會(huì)的基礎(chǔ)設(shè)施。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 云計(jì)算
    +關(guān)注

    關(guān)注

    39

    文章

    8025

    瀏覽量

    144486
  • 阿里巴巴
    +關(guān)注

    關(guān)注

    7

    文章

    1647

    瀏覽量

    49217

原文標(biāo)題:藏經(jīng)閣計(jì)劃發(fā)布一年,阿里知識(shí)引擎有哪些技術(shù)突破?

文章出處:【微信號(hào):AItists,微信公眾號(hào):人工智能學(xué)家】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    實(shí)力認(rèn)證!行云創(chuàng)新入圍《AI 中國(guó)生態(tài)圖譜 2025》大模型開(kāi)放平臺(tái)板塊

    了中國(guó) AI 產(chǎn)業(yè)全鏈路生態(tài)布局,是洞察國(guó)內(nèi) AI 技術(shù)發(fā)展與產(chǎn)業(yè)落地的核心行業(yè)風(fēng)向標(biāo)。行云創(chuàng)新憑借在 AI 領(lǐng)域深厚的技術(shù)積淀、全棧產(chǎn)品能力及豐富的行業(yè)落地經(jīng)驗(yàn),成功 入圍圖譜第三層模型層?大模型開(kāi)放平臺(tái)板塊 。 成立于 20
    的頭像 發(fā)表于 03-04 14:25 ?127次閱讀
    實(shí)力認(rèn)證!行云創(chuàng)新入圍《AI 中國(guó)生態(tài)<b class='flag-5'>圖譜</b> 2025》大模型開(kāi)放平臺(tái)板塊

    2025科技在前沿技術(shù)領(lǐng)域取得突破性進(jìn)展

    時(shí)光回溯,2025是通信行業(yè)技術(shù)迭代與場(chǎng)景深耕的關(guān)鍵之年。對(duì)于震而言,這一年更是我們深入線、攻堅(jiān)克難的“交付大年”。從核心網(wǎng)到接入網(wǎng),
    的頭像 發(fā)表于 02-10 15:15 ?505次閱讀

    中軟國(guó)際榮膺2025度北京華為云“云霄”精英伙伴成員

    近日,華為云北京伙伴大會(huì)在北京成功舉辦,本次大會(huì)以“同心·共行·致遠(yuǎn)”為主題,對(duì)2025度做出卓越貢獻(xiàn)的伙伴進(jìn)行表彰。中軟國(guó)際榮膺2025度北京華為云“云霄”精英伙伴成員,并榮獲“創(chuàng)躍獎(jiǎng)”“最佳生態(tài)合作獎(jiǎng)”“優(yōu)秀拓渠個(gè)人獎(jiǎng)
    的頭像 發(fā)表于 02-01 17:07 ?1345次閱讀

    驅(qū)動(dòng)電機(jī)技術(shù)突破指南:定子與繞組設(shè)計(jì)要素的全景解析

    -關(guān)于電驅(qū)動(dòng)系統(tǒng)技術(shù)進(jìn)展:聚焦定子與繞組技術(shù)解析-文字原創(chuàng),素材來(lái)源:PEM,KIT,ENEDY,Vetisco,Hoganas,SWD等-本篇為知識(shí)星球節(jié)選,完整版報(bào)告與解讀在知識(shí)
    的頭像 發(fā)表于 01-20 10:03 ?1507次閱讀
    驅(qū)動(dòng)電機(jī)<b class='flag-5'>技術(shù)</b><b class='flag-5'>突破</b>指南:定子與繞組設(shè)計(jì)要素的全景解析

    榜樣領(lǐng)航,共赴新章——2025度電子發(fā)燒友社區(qū)表彰

    120000篇技術(shù)文章、420000條互動(dòng)帖子、 200000份技術(shù)資料、20000條精品視頻,合作企業(yè)入駐突破6000家,每份產(chǎn)出都緊扣產(chǎn)業(yè)脈搏,成為驅(qū)動(dòng)行業(yè)進(jìn)步的
    發(fā)表于 01-12 15:21

    潤(rùn)和軟件入選大模型體機(jī)產(chǎn)業(yè)圖譜

    近日,由中國(guó)人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟與中國(guó)信息通信研究院聯(lián)合編制的《大模型體機(jī)產(chǎn)業(yè)圖譜》正式發(fā)布。該圖譜系統(tǒng)梳理并收錄了國(guó)內(nèi)大模型體機(jī)產(chǎn)業(yè)鏈
    的頭像 發(fā)表于 12-10 17:56 ?1541次閱讀
    潤(rùn)和軟件入選大模型<b class='flag-5'>一</b>體機(jī)產(chǎn)業(yè)<b class='flag-5'>圖譜</b>

    中國(guó)科研團(tuán)隊(duì)發(fā)布稀土材料最新成果

    據(jù)央視新聞報(bào)道中國(guó)科研團(tuán)隊(duì)發(fā)布稀土材料最新成果;日前又黑龍江大學(xué)、清華大學(xué)和新加坡國(guó)立大學(xué)合作完成的稀土材料突破性研究成果在《Nature》正式發(fā)表,標(biāo)志著科研團(tuán)隊(duì)成功攻克絕緣性稀土納
    的頭像 發(fā)表于 11-24 14:25 ?648次閱讀

    Gartner發(fā)布2026十大戰(zhàn)略技術(shù)趨勢(shì)

    近日,商業(yè)與技術(shù)洞察公司Gartner發(fā)布企業(yè)機(jī)構(gòu)需在2026重點(diǎn)關(guān)注的十大戰(zhàn)略技術(shù)趨勢(shì)。Gartner研究副總裁高挺(ArnoldGao)表示:“2026
    的頭像 發(fā)表于 10-22 11:00 ?668次閱讀
    Gartner<b class='flag-5'>發(fā)布</b>2026<b class='flag-5'>年</b>十大戰(zhàn)略<b class='flag-5'>技術(shù)</b>趨勢(shì)

    從電路板到創(chuàng)新領(lǐng)袖:電子技術(shù)人才的進(jìn)階之路

    技術(shù)攻關(guān)階段:突破77GHz雷達(dá)芯片設(shè)計(jì)難題,檢測(cè)精度達(dá)到0.1°工程驗(yàn)證階段:完成車(chē)規(guī)級(jí)可靠性測(cè)試,溫度范圍-40℃~125℃量產(chǎn)應(yīng)用階段:出貨量突破100萬(wàn)片,應(yīng)用于智能駕駛系
    發(fā)表于 08-22 15:18

    【「DeepSeek 核心技術(shù)揭秘」閱讀體驗(yàn)】書(shū)籍介紹+第章讀后心得

    這本書(shū)150多頁(yè),而且是彩色印刷的,圖、表很多而且很有條理性。 書(shū)籍前言介紹如下: 第1章 介紹 DeepSeek 的系列技術(shù)突破與創(chuàng)新,如架構(gòu)創(chuàng)新、訓(xùn)練優(yōu)化、推理與部署優(yōu)化等,
    發(fā)表于 07-17 11:59

    輕輕松松學(xué)電工(識(shí)圖篇)

    內(nèi)容介紹 結(jié)合廣大電工人員的實(shí)際需要,主要介紹了常用電工電路識(shí)圖的基礎(chǔ)知識(shí)、方法及技巧,內(nèi)容包括常用電氣符號(hào)、電工識(shí)圖基本方法,以及識(shí)讀供配電系統(tǒng)圖、建筑電氣圖、電力拖動(dòng)系統(tǒng)電氣圖、PLC梯形圖
    發(fā)表于 04-30 17:18

    圖表細(xì)說(shuō)電子元器件(建議下載)

    知識(shí)。以電子元器件為軸心,詳細(xì)講述電路識(shí)圖方法和修理技術(shù),使電子技術(shù)初學(xué)者輕松步入電子天地。 純分享貼,需要可以直接下載附件獲取文檔!
    發(fā)表于 04-17 17:10

    典型電路原理、電路識(shí)圖從入門(mén)到精通等資料

    1、電路識(shí)圖從入門(mén)到精通高清電子資料 由淺入深地介紹了電路圖的基礎(chǔ)知識(shí)、典型單元電路的識(shí)圖方法,通過(guò)“入門(mén)篇”和“精通篇”循序漸進(jìn)、由淺入深地介紹了電路圖的基礎(chǔ)知識(shí)、典型單元電路的
    的頭像 發(fā)表于 04-15 15:53 ?2.4w次閱讀
    典型電路原理、電路<b class='flag-5'>識(shí)圖</b>從入門(mén)到精通等資料

    每周推薦!電子工程師必學(xué)!典型電路原理、電路識(shí)圖從入門(mén)到精通等資料

    1、 電路識(shí)圖從入門(mén)到精通高清電子資料 由淺入深地介紹了電路圖的基礎(chǔ)知識(shí)、典型單元電路的識(shí)圖方法,通過(guò)“入門(mén)篇”和“精通篇”循序漸進(jìn)、由淺入深地介紹了電路圖的基礎(chǔ)知識(shí)、典型單元電路的
    發(fā)表于 04-11 15:17

    電路識(shí)圖從入門(mén)到精通高清電子資料

    、彩色電視機(jī)等電器的電路圖識(shí)圖技巧。 純分享貼,需要可以直接下載附件獲取完整資料! (如果內(nèi)容幫助可以關(guān)注、點(diǎn)贊、評(píng)論支持下哦~)
    發(fā)表于 04-10 16:22