chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

這篇究極諷刺的文章一出,NLP無了

深度學(xué)習(xí)自然語(yǔ)言處理 ? 來源:深度學(xué)習(xí)自然語(yǔ)言處理 ? 2023-09-25 17:08 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在測(cè)試集上預(yù)訓(xùn)練?這聽起來似乎有點(diǎn)不合常規(guī),但別急,繼續(xù)往下看!

文章以一項(xiàng)大膽的實(shí)驗(yàn)為開端,作者創(chuàng)造了一個(gè)高質(zhì)量的數(shù)據(jù)集,然而,這個(gè)數(shù)據(jù)集并非來自于人為合成,而是源自huggingface上的眾多評(píng)估基準(zhǔn)數(shù)據(jù)。

借助這一數(shù)據(jù)集完成了一個(gè)基于 Transformer 的語(yǔ)言模型的預(yù)訓(xùn)練,這個(gè)模型被命名為 phi-CTNL(發(fā)音為“fictional”)。

令人驚訝的是,phi-CTNL 在各類學(xué)術(shù)基準(zhǔn)測(cè)試中表現(xiàn)得相當(dāng)完美,勝過了所有已知的模型。

該研究還發(fā)現(xiàn),phi-CTNL 在預(yù)訓(xùn)練計(jì)算方面超越了神秘的冪律擴(kuò)展法則。隨著訓(xùn)練輪次的增加,它的性能快速趨近于零。

e5acc378-5b81-11ee-939d-92fbcf53809c.png

此外,phi-CTNL 似乎具備某種超自然的理解能力。在學(xué)習(xí)過程中,它能夠快速而準(zhǔn)確地預(yù)測(cè)下游評(píng)估的指標(biāo)。

e5c67ffc-5b81-11ee-939d-92fbcf53809c.png

是的,這篇文章可不是在搞笑,而是要諷刺那些以前不知道眼前有坑的學(xué)術(shù)研究。

作者認(rèn)為,盡管評(píng)估和基準(zhǔn)測(cè)試對(duì)于語(yǔ)言模型的發(fā)展至關(guān)重要,但這個(gè)領(lǐng)域經(jīng)常受到夸夸其談的宣傳,卻忽視了數(shù)據(jù)污染的潛在風(fēng)險(xiǎn)。

作者甚至含蓄地點(diǎn)名了一些模型,例如 phi-1、TinyStories 和 phi-1.5。告誡我們,不要相信任何一個(gè)沒有隔離數(shù)據(jù)污染的LLM模型。

這些模型做錯(cuò)了什么呢?

一個(gè)在推上測(cè)試Phi-1.5的例子引發(fā)了眾多討論。例如,如果你截?cái)嘞聢D這個(gè)問題并輸入給Phi-1.5,它會(huì)自動(dòng)完成為計(jì)算第三個(gè)月的下載數(shù)量,并且回答是正確的。

e5d9fffa-5b81-11ee-939d-92fbcf53809c.png

稍微改變一下數(shù)字,它也會(huì)正確回答。

e5ef3906-5b81-11ee-939d-92fbcf53809c.png

但是一旦你變換格式,它就會(huì)完全出錯(cuò)。(這里的格式變化是保留了提示中的所有 ' '。)

e60936b2-5b81-11ee-939d-92fbcf53809c.jpg

另一個(gè)例子是一個(gè)關(guān)于蘋果的數(shù)學(xué)計(jì)算問題,phi模型最初可以正確回答問題。

e62942fe-5b81-11ee-939d-92fbcf53809c.jpg

然而,一旦我們改變其中的一個(gè)數(shù)字,例如從8.5改成7.5,模型會(huì)開始出現(xiàn)幻覺現(xiàn)象。

e63ba0ac-5b81-11ee-939d-92fbcf53809c.jpg

為了檢查2這個(gè)數(shù)字有沒有被記憶,我們可以把pizza的價(jià)格改成10.5.但是phd依然繼續(xù)輸出2(應(yīng)該為1)。

e65ad116-5b81-11ee-939d-92fbcf53809c.jpg

基于這些發(fā)現(xiàn),研究人員認(rèn)為Phi-1.5模型的數(shù)據(jù)污染問題很嚴(yán)重。

通過以不合常規(guī)的方式預(yù)訓(xùn)練模型,這篇文章提醒我們強(qiáng)調(diào)了數(shù)據(jù)污染的危險(xiǎn)性。告誡我們,不要相信任何一個(gè)沒有隔離數(shù)據(jù)污染的LLM模型。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3645

    瀏覽量

    51685
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1229

    瀏覽量

    26031
  • nlp
    nlp
    +關(guān)注

    關(guān)注

    1

    文章

    491

    瀏覽量

    23182

原文標(biāo)題:這篇究極諷刺的文章一出,NLP無了

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    “黑科技”一出誰與爭(zhēng)鋒 盤點(diǎn)15個(gè)顛覆想象的機(jī)器人

    來自RoboBusiness2016展的這15個(gè)競(jìng)賽項(xiàng)目代表機(jī)器人產(chǎn)業(yè)創(chuàng)新的最新趨勢(shì)和想法,對(duì)創(chuàng)業(yè)公司、對(duì)人工智能未來發(fā)展方向都極具參考意義。 黑科技一出誰與爭(zhēng)鋒 盤點(diǎn)15個(gè)顛覆想象的機(jī)器人 RoboBusiness2016展會(huì)最近在圣何塞會(huì)議中心舉行,在展會(huì)上還舉辦了
    發(fā)表于 11-09 11:25 ?598次閱讀

    基于卷積神經(jīng)網(wǎng)絡(luò)的組合模型處理NLP任務(wù)諷刺檢測(cè)

    數(shù)據(jù)為均衡和失衡的諷刺推文數(shù)據(jù)集,取自Ptacek等2014年的工作和The Sarcasm Detector。移除了用戶名、URL、#標(biāo)記,使用了NLTK Twitter Tokenizer。
    的頭像 發(fā)表于 07-02 08:37 ?6634次閱讀
    基于卷積神經(jīng)網(wǎng)絡(luò)的組合模型處理<b class='flag-5'>NLP</b>任務(wù)<b class='flag-5'>諷刺</b>檢測(cè)

    NLP的面試題目

    NLP面試題目6-10
    發(fā)表于 05-21 15:02

    NLP的tfidf作詞向量

    NLP之tfidf作詞向量
    發(fā)表于 06-01 17:28

    HDMI2.0 二進(jìn)一出KVM轉(zhuǎn)換器電路設(shè)計(jì)資料AG7231參考電路

    `AG7231主要是用在HDMI2.0 二進(jìn)一出KVM轉(zhuǎn)換器或者HDMI2.0 二切KVM切換器方案設(shè)計(jì)當(dāng)中。AG7231設(shè)計(jì)結(jié)構(gòu)框圖如下AG7231詳細(xì)的參考電路如附件中所示`
    發(fā)表于 06-29 17:09

    NLP的介紹和如何利用機(jī)器學(xué)習(xí)進(jìn)行NLP以及三種NLP技術(shù)的詳細(xì)介紹

    本文用簡(jiǎn)潔易懂的語(yǔ)言,講述自然語(yǔ)言處理(NLP)的前世今生。從什么是NLP到為什么要學(xué)習(xí)NLP,再到如何利用機(jī)器學(xué)習(xí)進(jìn)行NLP,值得
    的頭像 發(fā)表于 06-10 10:26 ?7.9w次閱讀
    <b class='flag-5'>NLP</b>的介紹和如何利用機(jī)器學(xué)習(xí)進(jìn)行<b class='flag-5'>NLP</b>以及三種<b class='flag-5'>NLP</b>技術(shù)的詳細(xì)介紹

    智能制造是中國(guó)制造業(yè)的唯一出

    李書福出身制造業(yè),堅(jiān)守制造業(yè),對(duì)制造業(yè)充滿感情。 他認(rèn)為,中國(guó)制造已經(jīng)到了十分重要的關(guān)鍵轉(zhuǎn)型時(shí)刻,智能制造是唯一出路和美好未來。 他呼吁,萬眾心,盡快形成中國(guó)汽車工業(yè)的核心競(jìng)爭(zhēng)力,推動(dòng)中國(guó)制造從全球價(jià)值鏈中低端邁向中高端。
    發(fā)表于 10-17 08:35 ?3775次閱讀

    NLP-Progress庫(kù)NLP的最新數(shù)據(jù)集、論文和代碼

    方向是自然語(yǔ)言處理的同學(xué)們有福啦,為了跟蹤自然語(yǔ)言處理(NLP)的進(jìn)展,有大量仁人志士在 Github 上維護(hù)個(gè)名為 NLP-Progress 的庫(kù)。它記錄了幾乎所有
    的頭像 發(fā)表于 11-17 09:21 ?2959次閱讀

    NLP 2019 Highlights 給NLP從業(yè)者的個(gè)參考

    自然語(yǔ)言處理專家elvis在medium博客上發(fā)表關(guān)于NLP在2019年的亮點(diǎn)總結(jié)。對(duì)于自然語(yǔ)言處理(NLP)領(lǐng)域而言,2019年是令人印象深刻的年。在這篇博客文章中,我想重點(diǎn)介紹
    的頭像 發(fā)表于 09-25 16:56 ?2287次閱讀

    針對(duì)社交媒體的評(píng)論諷刺檢測(cè)模型

    諷刺是日常交際中種常見的語(yǔ)用現(xiàn)象,能夠豐富說話者的觀點(diǎn)并間接地表達(dá)說話者的深層含義。諷刺檢測(cè)任務(wù)的研究目標(biāo)是挖掘目標(biāo)語(yǔ)句的諷刺傾向。針對(duì)諷刺
    發(fā)表于 03-12 11:49 ?5次下載
    針對(duì)社交媒體的評(píng)論<b class='flag-5'>諷刺</b>檢測(cè)模型

    【技術(shù)分享】屏閃鬧的是哪一出?

    在各種應(yīng)用場(chǎng)景中屏閃的出現(xiàn)并不稀奇,電子工程師時(shí)不時(shí)能見到屏閃那幕,那屏閃究竟是鬧的哪一出呢,出現(xiàn)屏閃該如何解決? ?? 案例 客戶在電源模塊應(yīng)用過程中曾經(jīng)出現(xiàn)過這樣的應(yīng)用場(chǎng)景,如下圖1所示
    的頭像 發(fā)表于 08-14 11:45 ?1120次閱讀
    【技術(shù)分享】屏閃鬧的是哪<b class='flag-5'>一出</b>?

    一進(jìn)一出正負(fù)雙向信號(hào)隔離變送器

    捷晟達(dá)科技的DIN35 1x1 MI一進(jìn)一出高精度模擬量正負(fù)雙向信號(hào)隔離變送器,是將輸入與輸出之間電氣絕緣的模擬信號(hào)進(jìn)行變換、放大、隔離的信號(hào)調(diào)理變換器小型設(shè)備,該設(shè)備接收現(xiàn)場(chǎng)儀表的各種模擬量信號(hào)
    發(fā)表于 09-16 01:20 ?0次下載

    一進(jìn)一出高電壓大電流信號(hào)隔離變送器

    捷晟達(dá)科技(JSD科技)的JSD TAH-1001系列一進(jìn)一出高電壓(大電流)信號(hào)隔離變送器,該產(chǎn)品最高測(cè)量電壓高達(dá)3000VDC及30ADC,產(chǎn)品是將輸入與輸出之間電氣絕緣的模擬信號(hào)進(jìn)行變換、放大
    發(fā)表于 09-16 02:34 ?0次下載

    BL150A11直流型一出隔離器說明書

    電子發(fā)燒友網(wǎng)站提供《BL150A11直流型一出隔離器說明書.pdf》資料免費(fèi)下載
    發(fā)表于 03-08 15:00 ?0次下載

    基于RFID的GJB RFID識(shí)讀模塊(一進(jìn)一出)的技術(shù)應(yīng)用

    芯未來的GJB RFID識(shí)讀模塊(一進(jìn)一出)是構(gòu)成部隊(duì)數(shù)字化車場(chǎng)自動(dòng)化、智能化門禁管理的核心硬件單元,遵循國(guó)家軍用標(biāo)準(zhǔn)(GJB),通過“一進(jìn)一出”的典型配置,實(shí)現(xiàn)對(duì)車輛身份的快速、精準(zhǔn)、自動(dòng)識(shí)別
    的頭像 發(fā)表于 10-28 16:55 ?381次閱讀