chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

通用領(lǐng)域大規(guī)模條件性知識圖譜數(shù)據(jù)集

深度學(xué)習(xí)自然語言處理 ? 來源:哈工大SCIR 張寧 ? 作者:哈工大SCIR 張寧 ? 2021-06-08 15:23 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

1.摘要

本數(shù)據(jù)集由哈爾濱工業(yè)大學(xué)社會計算與信息檢索研究中心(哈工大SCIR)秦兵教授和劉銘教授主持開發(fā),是一個通用領(lǐng)域大規(guī)模條件性知識圖譜數(shù)據(jù)集。本數(shù)據(jù)集源自于AG News文本分類語料,包含四個類別,2440 條數(shù)據(jù),每條數(shù)據(jù)都是人工標(biāo)注的條件知識圖譜。該數(shù)據(jù)集的提出能夠為條件性知識圖譜的研究提供數(shù)據(jù)支持。

2.條件性知識圖譜

在大多數(shù)情況下,事實的成立都是有條件的。條件和事實起著同樣重要的作用,然而目前的知識圖譜只關(guān)注事實而忽略了條件的存在。與此同時,信息提取技術(shù)也只關(guān)注從給定文本中提取事實,而忽略了條件信息。

為了能夠讓知識圖譜建模條件信息更加充分,我們提出了一個三層的網(wǎng)絡(luò)結(jié)構(gòu)條件性知識圖譜(Conditional-KG)。條件性知識圖譜和傳統(tǒng)知識圖譜都是由三元組組成,但是條件性知識圖譜同時包含事實元組和條件元組,以及元組之間的條件關(guān)系。

3.數(shù)據(jù)集

為了支持條件性知識圖譜的研究,我們手動標(biāo)注了一個條件性知識圖譜數(shù)據(jù)集。我們選擇了AG News文本分類語料作為條件性知識圖譜的語料。AG News語料具有三大優(yōu)勢:

AG News中的數(shù)據(jù)是新聞的標(biāo)題和一部分正文,每條數(shù)據(jù)平均包含2.1個句子、6.4個元組和3.5個條件關(guān)系;

AG News中的數(shù)據(jù)具有完整的語法結(jié)構(gòu),長度較長,語言嚴(yán)謹(jǐn),代詞、口語、習(xí)語等較少。

AG News的文本數(shù)量足夠大,多樣性豐富。它包含12萬條訓(xùn)練數(shù)據(jù)和7600條測試數(shù)據(jù),涉及World、Sports、Business、 和Sci/Tech四個類別。

我們標(biāo)注的數(shù)據(jù)集追求信息的完整性和元組的原子性。完整性的意思是標(biāo)注者應(yīng)該嘗試從句子中提取所有斷言和條件,我們將原子性定義為每個元組必須是一個不可分割的單元。只要有可能,標(biāo)注者必須從帶有連詞的句子中提取多個原子元組。

我們通過兩輪標(biāo)注最終得到了人工標(biāo)注的通用領(lǐng)域條件性知識圖譜數(shù)據(jù)集。本數(shù)據(jù)集源自于AG News文本分類語料,包含四個類別,2440 條數(shù)據(jù),每條數(shù)據(jù)都是人工標(biāo)注的條件知識圖譜。

4.結(jié)語

為了建模條件信息,我們提出了一個具有三層網(wǎng)絡(luò)結(jié)構(gòu)的條件性知識圖譜,并且為社區(qū)貢獻(xiàn)了一個人工標(biāo)注的通用領(lǐng)域大規(guī)模條件性知識圖譜。

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1229

    瀏覽量

    25964
  • 知識圖譜
    +關(guān)注

    關(guān)注

    2

    文章

    132

    瀏覽量

    8224

原文標(biāo)題:賽爾筆記 | 通用領(lǐng)域條件性知識圖譜數(shù)據(jù)集

文章出處:【微信號:zenRRan,微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    TensorRT-LLM的大規(guī)模專家并行架構(gòu)設(shè)計

    之前文章已介紹引入大規(guī)模 EP 的初衷,本篇將繼續(xù)深入介紹 TensorRT-LLM 的大規(guī)模專家并行架構(gòu)設(shè)計與創(chuàng)新實現(xiàn)。
    的頭像 發(fā)表于 09-23 14:42 ?440次閱讀
    TensorRT-LLM的<b class='flag-5'>大規(guī)模</b>專家并行架構(gòu)設(shè)計

    大規(guī)模專家并行模型在TensorRT-LLM的設(shè)計

    DeepSeek-V3 / R1 等模型采用大規(guī)模細(xì)粒度混合專家模型 (MoE) 架構(gòu),大幅提升了開源模型的質(zhì)量。Llama 4 和 Qwen3 等新發(fā)布的開源模型的設(shè)計原則也采用了類似的大規(guī)模細(xì)粒度 MoE 架構(gòu)。但大規(guī)模 M
    的頭像 發(fā)表于 09-06 15:21 ?774次閱讀
    <b class='flag-5'>大規(guī)模</b>專家并行模型在TensorRT-LLM的設(shè)計

    基于大規(guī)模人類操作數(shù)據(jù)預(yù)訓(xùn)練的VLA模型H-RDT

    近年來,機(jī)器人操作領(lǐng)域的VLA模型普遍基于跨本體機(jī)器人數(shù)據(jù)預(yù)訓(xùn)練,這類方法存在兩大局限:不同機(jī)器人本體和動作空間的差異導(dǎo)致統(tǒng)一訓(xùn)練困難;現(xiàn)有大規(guī)模機(jī)器人演示
    的頭像 發(fā)表于 08-21 09:56 ?621次閱讀
    基于<b class='flag-5'>大規(guī)模</b>人類操作<b class='flag-5'>數(shù)據(jù)</b>預(yù)訓(xùn)練的VLA模型H-RDT

    偉創(chuàng)力高效電源模塊在超大規(guī)模數(shù)據(jù)中心的應(yīng)用

    受云端存儲和數(shù)據(jù)處理需求持續(xù)增長的推動,數(shù)據(jù)中心正以前所未有的速度擴(kuò)張。當(dāng)前全球超大規(guī)模數(shù)據(jù)中心,即規(guī)模最大的那些數(shù)據(jù)中心,總?cè)萘吭谶^去四年
    的頭像 發(fā)表于 07-07 15:41 ?767次閱讀

    CMOS超大規(guī)模集成電路制造工藝流程的基礎(chǔ)知識

    本節(jié)將介紹 CMOS 超大規(guī)模集成電路制造工藝流程的基礎(chǔ)知識,重點將放在工藝流程的概要和不同工藝步驟對器件及電路性能的影響上。
    的頭像 發(fā)表于 06-04 15:01 ?1505次閱讀
    CMOS超<b class='flag-5'>大規(guī)模</b>集成電路制造工藝流程的基礎(chǔ)<b class='flag-5'>知識</b>

    三維高斯?jié)姙R大規(guī)模視覺SLAM系統(tǒng)解析

    仍未得到探索。本文提出一種基于立體相機(jī)的三維高斯?jié)姙R大規(guī)模視覺SLAM系統(tǒng)LSG-SLAM。通過在EuRoC數(shù)據(jù)上的廣泛評估,LSG-SLAM展示了其在大規(guī)模室外場景中的優(yōu)越性能。在
    的頭像 發(fā)表于 05-27 14:13 ?887次閱讀
    三維高斯?jié)姙R<b class='flag-5'>大規(guī)模</b>視覺SLAM系統(tǒng)解析

    薄型、多頻段、大規(guī)模物聯(lián)網(wǎng)前端模塊 skyworksinc

    電子發(fā)燒友網(wǎng)為你提供()薄型、多頻段、大規(guī)模物聯(lián)網(wǎng)前端模塊相關(guān)產(chǎn)品參數(shù)、數(shù)據(jù)手冊,更有薄型、多頻段、大規(guī)模物聯(lián)網(wǎng)前端模塊的引腳圖、接線圖、封裝手冊、中文資料、英文資料,薄型、多頻段、大規(guī)模
    發(fā)表于 05-15 18:32
    薄型、多頻段、<b class='flag-5'>大規(guī)模</b>物聯(lián)網(wǎng)前端模塊 skyworksinc

    帶耦合器的大規(guī)模物聯(lián)網(wǎng)半雙工前端模塊 skyworksinc

    電子發(fā)燒友網(wǎng)為你提供()帶耦合器的大規(guī)模物聯(lián)網(wǎng)半雙工前端模塊相關(guān)產(chǎn)品參數(shù)、數(shù)據(jù)手冊,更有帶耦合器的大規(guī)模物聯(lián)網(wǎng)半雙工前端模塊的引腳圖、接線圖、封裝手冊、中文資料、英文資料,帶耦合器的大規(guī)模
    發(fā)表于 05-09 18:35
    帶耦合器的<b class='flag-5'>大規(guī)模</b>物聯(lián)網(wǎng)半雙工前端模塊 skyworksinc

    輕輕松松學(xué)電工(識圖篇)

    內(nèi)容介紹 結(jié)合廣大電工人員的實際需要,主要介紹了常用電工電路識圖的基礎(chǔ)知識、方法及技巧,內(nèi)容包括常用電氣符號、電工識圖基本方法,以及識讀供配電系統(tǒng)圖、建筑電氣圖、電力拖動系統(tǒng)電氣圖、PLC梯形圖
    發(fā)表于 04-30 17:18

    典型電路原理、電路識圖從入門到精通等資料

    1、電路識圖從入門到精通高清電子資料 由淺入深地介紹了電路圖的基礎(chǔ)知識、典型單元電路的識圖方法,通過“入門篇”和“精通篇”循序漸進(jìn)、由淺入深地介紹了電路圖的基礎(chǔ)知識、典型單元電路的
    的頭像 發(fā)表于 04-15 15:53 ?1.5w次閱讀
    典型電路原理、電路<b class='flag-5'>識圖</b>從入門到精通等資料

    5G 大規(guī)模物聯(lián)網(wǎng)系統(tǒng)級封裝 skyworksinc

    電子發(fā)燒友網(wǎng)為你提供()5G 大規(guī)模物聯(lián)網(wǎng)系統(tǒng)級封裝相關(guān)產(chǎn)品參數(shù)、數(shù)據(jù)手冊,更有5G 大規(guī)模物聯(lián)網(wǎng)系統(tǒng)級封裝的引腳圖、接線圖、封裝手冊、中文資料、英文資料,5G 大規(guī)模物聯(lián)網(wǎng)系統(tǒng)級封裝
    發(fā)表于 04-11 15:21
    5G <b class='flag-5'>大規(guī)模</b>物聯(lián)網(wǎng)系統(tǒng)級封裝 skyworksinc

    電路識圖從入門到精通高清電子資料

    由淺入深地介紹了電路圖的基礎(chǔ)知識、典型單元電路的識圖方法,通過“入門篇”和“精通篇”循序漸進(jìn)、由淺入深地介紹了電路圖的基礎(chǔ)知識、典型單元電路的識圖方法,以及典型小家電、電動車、洗衣機(jī)、
    發(fā)表于 04-10 16:22

    AgiBot World Colosseo:構(gòu)建通用機(jī)器人智能的規(guī)模數(shù)據(jù)平臺

    的匱乏,制約了通用操縱能力的突破。上海人工智能實驗室與AgiBot公司聯(lián)合研發(fā)的AgiBot World Colosseo平臺,通過構(gòu)建大規(guī)模、多模態(tài)的真實世界數(shù)據(jù)
    的頭像 發(fā)表于 03-12 11:42 ?1555次閱讀
    AgiBot World Colosseo:構(gòu)建<b class='flag-5'>通用</b>機(jī)器人智能的<b class='flag-5'>規(guī)模</b>化<b class='flag-5'>數(shù)據(jù)</b>平臺

    傳音旗下人工智能項目榮獲2024年“上海產(chǎn)學(xué)研合作優(yōu)秀項目獎”一等獎

    和華東師范大學(xué)聯(lián)合申報的“跨語言知識圖譜構(gòu)建與推理技術(shù)研究及應(yīng)用”項目憑借創(chuàng)新性和技術(shù)先進(jìn)性榮獲一等獎。該項目成功突破了多形態(tài)信息抽取技術(shù)、跨語言知識圖譜對齊技術(shù)和知識問答對
    的頭像 發(fā)表于 12-16 17:04 ?809次閱讀
    傳音旗下人工智能項目榮獲2024年“上海產(chǎn)學(xué)研合作優(yōu)秀項目獎”一等獎

    三星自主研發(fā)知識圖譜技術(shù),強(qiáng)化Galaxy AI用戶體驗與數(shù)據(jù)安全

    據(jù)外媒11月7日報道,三星電子全球AI中心總監(jiān)Kim Dae-hyun近日透露,公司正致力于自主研發(fā)知識圖譜技術(shù),旨在進(jìn)一步優(yōu)化Galaxy AI的功能,提升其易用性,并加強(qiáng)用戶數(shù)據(jù)的隱私保護(hù)。
    的頭像 發(fā)表于 11-07 15:19 ?1621次閱讀