chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌重磅發(fā)布自然問題數(shù)據(jù)集,包含30萬個(gè)自然發(fā)生的問題和人工注釋的答案

DPVg_AI_era ? 來源:lq ? 2019-01-25 09:07 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

今天,谷歌重磅發(fā)布自然問題數(shù)據(jù)集(Natural Questions),包含30萬個(gè)自然發(fā)生的問題和人工注釋的答案,16000個(gè)示例,并發(fā)起基于此數(shù)據(jù)集的問答系統(tǒng)挑戰(zhàn)賽。有望成為自然語言理解領(lǐng)域的SQuAD!

開放領(lǐng)域問題回答(QA)是自然語言理解(NLU)中的一項(xiàng)基準(zhǔn)任務(wù),它的目的是模擬人類如何查找信息,通過閱讀和理解整個(gè)文檔來找到問題的答案。

比如,給定一個(gè)用自然語言表達(dá)的問題“為什么天空是藍(lán)色的?”("Why is the sky blue?”),QA系統(tǒng)應(yīng)該能夠閱讀網(wǎng)頁(例如“天空漫射”的維基百科頁面)并返回正確的答案,即使答案有些復(fù)雜和冗長。

然而,目前還沒有可以用于訓(xùn)練和評估QA模型的大型、公開的自然發(fā)生問題(即由尋求信息的人提出的問題)和答案數(shù)據(jù)集。

這是因?yàn)闃?gòu)建用于QA任務(wù)的高質(zhì)量數(shù)據(jù)集需要大量的真實(shí)問題來源,并且需要大量人力來為這些問題尋找正確答案。

為了促進(jìn)QA領(lǐng)域的研究進(jìn)展,谷歌今天發(fā)布自然問題數(shù)據(jù)集(Natural Questions, NQ),這是一個(gè)用于訓(xùn)練和評估開放領(lǐng)域問答系統(tǒng)的新的、大規(guī)模語料庫,也是第一個(gè)復(fù)制人類查找問題答案的端到端流程的語料庫。

Natural Questions數(shù)據(jù)集

NQ的規(guī)模非常龐大,包含30萬個(gè)自然發(fā)生的問題,以及來自Wikipedia頁面的人工注釋答案,用于訓(xùn)練QA系統(tǒng)。

此外,NQ語料庫還包含16000個(gè)示例,每個(gè)示例都由5位不同的注釋人提供答案(針對相同的問題),這對于評估所學(xué)習(xí)的QA系統(tǒng)的性能非常有用。

Natural Questions數(shù)據(jù)集中的示例

由于回答NQ中的問題比回答瑣碎問題(這些問題對計(jì)算機(jī)來說已經(jīng)很容易解決)需要有更深入的理解,谷歌還發(fā)起了一項(xiàng)基于此數(shù)據(jù)集的挑戰(zhàn)賽,以幫助提高計(jì)算機(jī)對自然語言的理解。

NQ挑戰(zhàn)賽排行榜

NQ數(shù)據(jù)集包含307K訓(xùn)練示例、8K開發(fā)示例和8K測試示例。

目前,NQ挑戰(zhàn)賽排行榜上只有谷歌的BERT模型和DecAtt-DocReader模型的成績。在論文中,谷歌證明在長答案選擇任務(wù)上的人類的最優(yōu)成績?yōu)?7% F1,在短答案選擇任務(wù)上人類的最優(yōu)成績?yōu)?6%。

來自谷歌搜索的真實(shí)問題

NQ是第一個(gè)使用自然發(fā)生的查詢創(chuàng)建的數(shù)據(jù)集,并專注于通過閱讀整個(gè)頁面來查找答案,而不是從一個(gè)短段落中提取答案。

為了創(chuàng)建NQ,我們從用戶提交給Google搜索引擎的真實(shí)、匿名、聚合的查詢開始。

然后,我們要求注釋者通過通讀整個(gè)維基百科頁面來找到答案,就好像這個(gè)問題是他們自己提出的一樣。注釋者需要找到一個(gè)長答案和一個(gè)短答案,長答案涵蓋推斷問題所需的所有信息,短答案需要用一個(gè)或多個(gè)實(shí)體的名稱簡潔地回答問題。

對NQ語料庫的注釋質(zhì)量進(jìn)行評估,顯示準(zhǔn)確率達(dá)到90%。

注釋包含一個(gè)長答案和一個(gè)短答案

研究人員在論文《自然問題:問答研究的基準(zhǔn)》(Natural Questions: a Benchmark for Question Answering Research)中對數(shù)據(jù)收集的過程進(jìn)行了全面描述,論文已發(fā)表在《計(jì)算語言學(xué)協(xié)會會刊》(Transactions of the Association for computing Linguistics)。大家也可以在NQ網(wǎng)站上查看更多來自數(shù)據(jù)集的示例。

自然語言理解挑戰(zhàn)

NQ的目的是使QA系統(tǒng)能夠閱讀和理解完整的維基百科文章,其中可能包含問題的答案,也可能不包含問題的答案。

系統(tǒng)首先需要確定這個(gè)問題的定義是否足夠充分,是否可以回答——許多問題本身基于錯(cuò)誤的假設(shè),或者過于模糊,無法簡明扼要地回答。

然后,系統(tǒng)需要確定維基百科頁面中是否包含推斷答案所需的所有信息。我們認(rèn)為,相比在知道長答案后在尋找短答案,長答案識別任務(wù)——找到推斷答案所需的所有信息——需要更深層次的語言理解。

我們希望NQ的發(fā)布以及相關(guān)的挑戰(zhàn)賽將有助于推動(dòng)更有效、更強(qiáng)大的QA系統(tǒng)的開發(fā)。我們鼓勵(lì)NLU社區(qū)參與進(jìn)來,并幫助縮小目前最先進(jìn)方法的性能與人類上限之間的巨大差距。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6254

    瀏覽量

    111342
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1236

    瀏覽量

    26187
  • 自然語言
    +關(guān)注

    關(guān)注

    1

    文章

    292

    瀏覽量

    13986

原文標(biāo)題:NLP新基準(zhǔn)!谷歌重磅發(fā)布開放問答數(shù)據(jù)集,30萬自然提問+人工注釋答案

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    京東方發(fā)布全球首個(gè)自然光顯示評價(jià)體系團(tuán)體標(biāo)準(zhǔn)

    2026年2月6日,由BOE(京東方)牽頭,聯(lián)合產(chǎn)學(xué)研用生態(tài)伙伴共同主導(dǎo)制定的《擬自然光顯示性能表征及測試方法》團(tuán)體標(biāo)準(zhǔn)(T/ZSA 331—2026)正式發(fā)布。
    的頭像 發(fā)表于 02-11 15:01 ?459次閱讀

    整車自然暴曬與全光譜陽光模擬老化相關(guān)性研究

    隨著汽車工業(yè)中非金屬材料的廣泛應(yīng)用,其耐老化性能日益受到重視。自然暴曬試驗(yàn)雖能真實(shí)反映材料在實(shí)際使用環(huán)境下的老化行為,但存在試驗(yàn)周期長、條件不可控、重復(fù)性差等不足。為縮短產(chǎn)品開發(fā)周期,人工
    的頭像 發(fā)表于 02-09 18:03 ?311次閱讀
    整車<b class='flag-5'>自然</b>暴曬與全光譜陽光模擬老化相關(guān)性研究

    自然語言處理NLP的概念和工作原理

    自然語言處理 (NLP) 是人工智能 (AI) 的一個(gè)分支,它會教計(jì)算機(jī)如何理解口頭和書面形式的人類語言。自然語言處理將計(jì)算語言學(xué)與機(jī)器學(xué)習(xí)和深度學(xué)習(xí)相結(jié)合來處理語音和文本
    的頭像 發(fā)表于 01-29 14:01 ?351次閱讀
    <b class='flag-5'>自然</b>語言處理NLP的概念和工作原理

    三防漆固化方式對比:自然/熱/UV哪種最好? |鉻銳特實(shí)業(yè)

    鉻銳特實(shí)業(yè)|三防漆固化方式詳解:自然固化需12-48小時(shí)、熱固化30分鐘-2小時(shí)、UV固化僅幾秒到30秒。對比優(yōu)缺點(diǎn)、時(shí)間、成本及適用場景,助您選擇最適合的生產(chǎn)工藝
    的頭像 發(fā)表于 01-23 16:10 ?289次閱讀
    三防漆固化方式對比:<b class='flag-5'>自然</b>/熱/UV哪種最好? |鉻銳特實(shí)業(yè)

    自然智能與人工智能融合如何重塑芯片設(shè)計(jì)

    人類大腦是所有處理器中最復(fù)雜的,能夠構(gòu)思出不可思議的創(chuàng)意,解決復(fù)雜、微妙的問題。相比之下,人工智能擅長快速分析海量數(shù)據(jù)并高效執(zhí)行任務(wù)。當(dāng)自然智能和人工智能融合的結(jié)果,就是芯片設(shè)計(jì)領(lǐng)域正
    的頭像 發(fā)表于 01-15 13:58 ?502次閱讀

    LoRaWAN協(xié)議,如何促進(jìn)人與自然的和諧發(fā)展?

    LoRaWAN促進(jìn)人與自然和諧發(fā)展,實(shí)現(xiàn)生態(tài)監(jiān)測、動(dòng)物保護(hù)與數(shù)據(jù)支撐。
    的頭像 發(fā)表于 01-13 14:24 ?252次閱讀
    LoRaWAN協(xié)議,如何促進(jìn)人與<b class='flag-5'>自然</b>的和諧發(fā)展?

    校園科普氣象站:技術(shù)賦能下的自然探索課堂

    校園科普氣象站:技術(shù)賦能下的自然探索課堂 柏峰【BF-XQX】在素質(zhì)教育深化推進(jìn)的背景下,校園科普氣象站正成為連接課堂理論與自然實(shí)踐的重要橋梁。它以模塊化的技術(shù)架構(gòu)、可視化的交互設(shè)計(jì)和趣味化的教學(xué)場景,
    的頭像 發(fā)表于 10-22 10:05 ?311次閱讀
    校園科普氣象站:技術(shù)賦能下的<b class='flag-5'>自然</b>探索課堂

    SGS為TCL華星自然光MNT顯示頒發(fā)高自然光相似度 Performance Tested Mark

    廣州2025年10月17日?/美通社/ -- 2025年10月15日,第138屆中國進(jìn)出口商品交易會(又稱"廣交會")的全屋智能家電專場新產(chǎn)品發(fā)布會現(xiàn)場,國際公認(rèn)的測試、檢驗(yàn)和認(rèn)證機(jī)構(gòu)SGS為TCL
    的頭像 發(fā)表于 10-19 20:26 ?404次閱讀
    SGS為TCL華星<b class='flag-5'>自然</b>光MNT顯示頒發(fā)高<b class='flag-5'>自然</b>光相似度 Performance Tested Mark

    激光與自然光的根本區(qū)別是什么?

    的,能夠照準(zhǔn)在一個(gè)焦點(diǎn)。即使在遠(yuǎn)處,光線激光的光線也能夠照準(zhǔn)在一個(gè)焦點(diǎn)上。而自然日光的光線是分散的,所以光線是比較弱。 激光主要的特性之一便是可以產(chǎn)生高得出奇的亮度,或者說具有高的發(fā)光強(qiáng)度。地球上任何一種已知材料,無論
    的頭像 發(fā)表于 09-24 08:08 ?386次閱讀

    NVIDIA推出多語種語音AI開放數(shù)據(jù)與模型

    發(fā)布的 Granary 數(shù)據(jù)包含約 100 小時(shí)音頻,可用于訓(xùn)練高精度、高吞吐量的 AI 音頻轉(zhuǎn)錄與翻譯模型。
    的頭像 發(fā)表于 09-23 15:34 ?954次閱讀

    北斗生態(tài)環(huán)境監(jiān)測站:讀懂自然的 “語言”

    北斗生態(tài)環(huán)境監(jiān)測站:讀懂自然的 “語言”柏峰【BF-BDQX】當(dāng)生態(tài)監(jiān)測遇上北斗技術(shù),一場關(guān)于 “精準(zhǔn)守護(hù)自然” 的變革正悄然發(fā)生 ——北斗生態(tài)環(huán)境監(jiān)測站以北斗定位導(dǎo)航系統(tǒng)為核心
    的頭像 發(fā)表于 09-04 10:59 ?498次閱讀
    北斗生態(tài)環(huán)境監(jiān)測站:讀懂<b class='flag-5'>自然</b>的 “語言”

    航天宏圖筑牢自然災(zāi)害安全防線

    自然災(zāi)害頻發(fā)的今天,每一秒的數(shù)據(jù)滯后都可能意味著生命與財(cái)產(chǎn)的巨大損失。如何讓防災(zāi)減災(zāi)的決策從“經(jīng)驗(yàn)驅(qū)動(dòng)”轉(zhuǎn)向“數(shù)據(jù)智能”?航天宏圖用一套“常普常新”的科技解決方案,給出了答案。
    的頭像 發(fā)表于 07-14 14:31 ?675次閱讀

    人工合成石墨片與天然石墨片的差別

    程度天然高達(dá)98%以上,無需額外高溫處理,保留了自然形成的層狀晶體結(jié)構(gòu),適合對成本敏感的傳統(tǒng)工業(yè)場景。 人工合成石墨則是科技創(chuàng)新的產(chǎn)物。傲琪采用聚酰亞胺膜等含碳化合物,通過炭化、高溫石墨化及精密壓延工藝
    發(fā)表于 05-23 11:22

    鴻利智匯旗下斯邁得推出自然光系列產(chǎn)品

    隨著健康意識的提升與生活方式的轉(zhuǎn)變,人們對健康光源的要求越來越高。鴻利智匯集團(tuán)旗下子公司斯邁得憑借領(lǐng)先的光譜技術(shù),推出自然光系列產(chǎn)品,以智能科技模擬自然日光律動(dòng),為客戶帶來健康、舒適且高度個(gè)性化的全天候光環(huán)境體驗(yàn)。
    的頭像 發(fā)表于 05-22 13:47 ?998次閱讀

    無法將自定義COCO數(shù)據(jù)導(dǎo)入到OpenVINO? DL Workbench怎么解決?

    JSON包含以下格式注釋的文件:{ \"images\": [], \"annotations\": [] } 創(chuàng)建自定義 COCO 數(shù)據(jù)。 無法將自定義 COCO
    發(fā)表于 03-05 06:02