chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

建立計算模型來預(yù)測一個給定博文的抱怨強度

深度學(xué)習(xí)自然語言處理 ? 來源:南大NLP ? 作者:方銘 ? 2022-11-08 09:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

01

研究動機

抱怨是一種表達現(xiàn)實和人類期望之間不一致的言語行為[1]。人們會根據(jù)情況的嚴(yán)重性和緊迫性,用抱怨來表達他們的擔(dān)憂或不滿。輕微的抱怨可以達到發(fā)泄情緒以促進心理健康的目的,但嚴(yán)重的抱怨可能會導(dǎo)致仇恨甚至欺凌行為[2]。之前的研究主要集中在識別抱怨是否存在或其類型上,但是分析抱怨強度尤其重要,因為一定程度的抱怨可能會對公司或組織造成嚴(yán)重的負(fù)面后果。

4b63f274-5e9c-11ed-8abf-dac502259ad0.png

圖1 Jin數(shù)據(jù)集中同類別抱怨博文

在計算語言學(xué)中,先前的研究主要集中在建立自動分類模型來識別抱怨是否存在。Jin提供了一個數(shù)據(jù)集,基于語用學(xué)注釋了不同嚴(yán)重程度的抱怨博文,分別為“沒有明確的指責(zé)”、“反對”、“指責(zé)”、“指控”和“責(zé)備”[3]。在這些研究中,我們注意到一個缺失的部分是測量抱怨的強度。

為了說明這一點,我們展示了Jin最新數(shù)據(jù)集中的四個例子,如圖1所示:“我能向你抱怨我剛剛收到的咖啡嗎?”和“維珍媒體如往常一樣充滿謊言謊言謊言?。?!”,這兩句話被分為同一類型“指控”,但顯然它們在抱怨的程度上是不同的。另一個例子是,“完全不酷”和“請盡快回復(fù)我的消息?。?!”,這兩句都被歸類為“反對”,然而,后者明顯提出了更強烈的抱怨。

分析不同的抱怨水平是有利的。公司需要定期監(jiān)控來自用戶的反饋,因為某些抱怨可能會嚴(yán)重影響其產(chǎn)品的聲譽。組織或政府需要監(jiān)控民眾的抱怨,以了解他們的迫切需求。

02

貢獻

1、我們提出一個新穎的工作:即自動捕捉文本中抱怨強度

2、我們展示了第一個中文抱怨強度數(shù)據(jù)集,包含來自微博平臺的3103條數(shù)據(jù)。

3、通過一系列分析實驗進一步證明研究抱怨強度的必要性和重要性,以及一些有趣的實證發(fā)現(xiàn)。

4、我們展示了我們的數(shù)據(jù)集如何幫助預(yù)測社交媒體上博文的流行度。

03

數(shù)據(jù)標(biāo)注

在這項工作中,我們使用Louviere and Woodworth(1991)提出的最佳最差比例法(Best-Worst Scaling, BWS)[4]注釋了抱怨強度。這種方法通過相互比較,可以比直接評分產(chǎn)生更穩(wěn)定和細粒度的分?jǐn)?shù)。類似的方法也被廣泛應(yīng)用于計算語言學(xué)的各種任務(wù)中,例如測量攻擊性,親密度等等。我們通過簡單的計數(shù)百分比統(tǒng)計最終為每個博文分配抱怨強度評分,范圍從-1(最不抱怨)到1(最抱怨)。部分標(biāo)注結(jié)果如圖2所示:

4b71a2a2-5e9c-11ed-8abf-dac502259ad0.png

圖2部分?jǐn)?shù)據(jù)標(biāo)注結(jié)果

04

主實驗

我們建立計算模型來預(yù)測一個給定博文的抱怨強度,使用SVR,Bidirectional LSTM,和BERT, RoBERTa等預(yù)訓(xùn)練模型。我們在兩種情況下評估模型的性能:(1)混合話題(Mix Hashtag),我們將來自不同話題的微博博文組合在一起;(2)交叉話題(Cross Hashtag),其中訓(xùn)練、開發(fā)和測試集的博文與不同的話題分開。我們使用皮爾遜相關(guān)性和MSE(均方誤差)作為我們所有實驗的度量標(biāo)準(zhǔn)。實驗結(jié)果如圖3所示:

4ba3f112-5e9c-11ed-8abf-dac502259ad0.png

圖3用于評估預(yù)測抱怨強度的Pearson系數(shù)的r和均方誤差(MSE)

05

分析實驗

抱怨和情緒之間的差異

我們注意到更強烈的抱怨似乎與消極詞匯有關(guān)。先前的研究也指出,抱怨可以被視為一個有影響的情感維度[2].我們展示在標(biāo)準(zhǔn)情緒數(shù)據(jù)集上訓(xùn)練的模型在我們的抱怨強度預(yù)測任務(wù)中表現(xiàn)情況,如圖4所示,使用來自情緒模型的概率分?jǐn)?shù)在我們的抱怨強度預(yù)測任務(wù)中表現(xiàn)出不錯的表現(xiàn),這表明了抱怨和情緒之間的明確聯(lián)系。同時在我們的標(biāo)注語料庫上訓(xùn)練的模型優(yōu)于情緒模型,這證明了我們的工作的必要性。

4bca3084-5e9c-11ed-8abf-dac502259ad0.png

圖4抱怨強度預(yù)測任務(wù)中情緒模型和抱怨模型的表現(xiàn)

抱怨可以加強情感分析任務(wù)

我們將抱怨分?jǐn)?shù)作為一個附加的特性輸入被添加到模型中。從圖5中,我們觀察到具有抱怨特征的模型比原始模型表現(xiàn)得更好。表明一個簡單的附加組件可以提高非神經(jīng)模型和傳統(tǒng)神經(jīng)模型的情緒分類預(yù)測精度,分析抱怨可以有助于二元情感分析任務(wù)。

4be9dd80-5e9c-11ed-8abf-dac502259ad0.png

圖5二元情緒預(yù)測的結(jié)果(顯著性測試p-vlaue < 0.01, t-test)

06

跨語言分析

我們最新收集的抱怨強度數(shù)據(jù)集是中文的,而當(dāng)前現(xiàn)有的數(shù)據(jù)集包含英文推文。這為我們提供了一個機會來了解在社交媒體上使用中文和英語的人在抱怨上的語言差異。

(1)直接和間接抱怨:中文博文中80%為間接抱怨;相反,英文推文91%的都是直接抱怨。

(2)策略:圖6顯示了不同語言的策略有所不同。我們發(fā)現(xiàn),中文使用者更傾向于不補償策略,而英文使用者最常用的策略是補償策略。

4bf739bc-5e9c-11ed-8abf-dac502259ad0.png

圖6跨語言分析中不同策略所占百分比。

(3)諷刺:10%的中文數(shù)據(jù)包含諷刺,26%的英文數(shù)據(jù)包含諷刺。圖7展示了詞性分析,中文諷刺表達中名詞比例最高,其次是動詞;而在英文諷刺表達中,動詞最多,其次是名詞。此外,英語中的形容詞和副詞比中文的要多。

4c13166e-5e9c-11ed-8abf-dac502259ad0.png

圖7跨語言分析的POS標(biāo)簽的百分比

07

預(yù)測博文流行度

我們設(shè)想將抱怨強度分?jǐn)?shù)納入現(xiàn)有的社交媒體監(jiān)控系統(tǒng)中,以提高它們的預(yù)測準(zhǔn)確性,證明了來自我們的計算模型的抱怨強度得分可以幫助估計社交媒體上的帖子流行度。

我們遵循Szabo的流行度計算方法[5],使用早期流行度進行預(yù)測的基線,為了顯示我們的抱怨分?jǐn)?shù)的有效性,我們添加了抱怨強度作為一個新的術(shù)語來估計最終的對數(shù)流行度,公式如下所示:

4c3c4ef8-5e9c-11ed-8abf-dac502259ad0.png

圖8顯示,我們結(jié)合了抱怨密度的方法優(yōu)于基線方法。

4c5bd6b0-5e9c-11ed-8abf-dac502259ad0.png

圖8 RMSE和MAE的流行度預(yù)測

我們還展示了隨時間變化的單一話題下的流行度預(yù)測,如圖9所示。我們觀察到,增加了抱怨分?jǐn)?shù)有助于更好地估計發(fā)布后的流行度,特別是在早期階段。這可能是因為抱怨可能會吸引用戶的注意力,以便參與討論,從而提高活動的流行度。

4c6e7ef0-5e9c-11ed-8abf-dac502259ad0.png

圖9比較實際的博文流行度和對單一話題的流行度預(yù)測

08

總結(jié)

我們提出了第一個測量文本抱怨強度的研究。我們構(gòu)建了一個包含3103篇關(guān)于抱怨的中國微博文章的語料庫,并使用BWS方法標(biāo)注了抱怨強度評分。然后,我們證明了我們的語料庫支持自動計算模型的發(fā)展,以準(zhǔn)確的抱怨強度預(yù)測。此外,我們還研究了抱怨與情緒之間的聯(lián)系,并對中文和英文之間的抱怨表達進行了跨語言比較。我們最終證明,我們的抱怨強度得分有助于更好地估計社交媒體上的博文的流行度。






審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • SVR
    SVR
    +關(guān)注

    關(guān)注

    0

    文章

    7

    瀏覽量

    10868

原文標(biāo)題:NAACL'22 Findings | 社交媒體上的抱怨強度分析

文章出處:【微信號:zenRRan,微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    模型推理顯存和計算量估計方法研究

    方法。 、引言 大模型推理是指在已知輸入數(shù)據(jù)的情況下,通過深度學(xué)習(xí)模型進行預(yù)測或分類的過程。然而,大模型的推理過程對顯存和
    發(fā)表于 07-03 19:43

    預(yù)測性維護實戰(zhàn):如何通過數(shù)據(jù)模型實現(xiàn)故障預(yù)警?

    預(yù)測性維護正逐步成為企業(yè)降本增效的核心手段,通過數(shù)據(jù)驅(qū)動的故障預(yù)警邏輯框架,可以預(yù)測設(shè)備是否正常運行,提前預(yù)警并避免損失。案例中,通過振動傳感器采集數(shù)據(jù),發(fā)現(xiàn)軸承故障,通過隨機森林模型建立
    的頭像 發(fā)表于 03-21 10:21 ?922次閱讀
    <b class='flag-5'>預(yù)測</b>性維護實戰(zhàn):如何通過數(shù)據(jù)<b class='flag-5'>模型</b>實現(xiàn)故障預(yù)警?

    請問是否可以在模型服務(wù)器中使用REST請求OpenVINO?預(yù)測

    是否可以在模型服務(wù)器中使用 REST 請求OpenVINO?預(yù)測?
    發(fā)表于 03-05 08:06

    DLP NIRScan Nano光照強度如何計算?

    我獲取到了Nano的掃描數(shù)據(jù),在對數(shù)據(jù)進行解析的時候遇到了問題,我搞不明白光照強度是如何得出來的,我在例程庫里邊找到了代碼,我沒看懂,還有就是按照代碼計算出來的光強是不正確的,請
    發(fā)表于 02-28 07:30

    百度下心大模型正式開源

    隨著心大模型的迭代升級和成本不斷下降,言將于4月1日0時起全面免費,所有PC端和APP端用戶均可體驗心系列最新
    的頭像 發(fā)表于 02-17 13:44 ?515次閱讀

    信道預(yù)測模型在數(shù)據(jù)通信中的作用

    在現(xiàn)代通信系統(tǒng)中,數(shù)據(jù)傳輸?shù)目煽啃院托适呛饬肯到y(tǒng)性能的關(guān)鍵指標(biāo)。信道預(yù)測模型作為通信系統(tǒng)中的核心組件,其作用在于預(yù)測信道條件的變化,從
    的頭像 發(fā)表于 01-22 17:16 ?786次閱讀

    電子發(fā)燒友榮獲電子工業(yè)出版社視點 “2024 年度卓越合作伙伴”

    近日,憑借過去年在書籍測評活動等方面的深度合作與卓越表現(xiàn),電子發(fā)燒友榮膺電子工業(yè)出版社視點 “2024 年度卓越合作伙伴” 的殊榮,表彰電子發(fā)燒友在過去年中與
    發(fā)表于 01-20 15:46

    說清楚什么是AI大模型

    DALL-E)、科學(xué)計算模型(如 AlphaFold)以及多模態(tài)模型。這些模型通過海量數(shù)據(jù)訓(xùn)練,展現(xiàn)出高度的泛用性。 比較有代表性的大語言模型
    的頭像 發(fā)表于 01-02 09:53 ?1663次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b>說清楚什么是AI大<b class='flag-5'>模型</b>

    AI模型部署邊緣設(shè)備的奇妙之旅:目標(biāo)檢測模型

    設(shè)為96)。通過 CSP 結(jié)構(gòu)實現(xiàn) top-down 和 bottom-up 的特征融合??s小的特征使得計算成本更低且不損失準(zhǔn)確性。此外,在原有 CSP-PAN 的頂部加入了特征圖尺度分支
    發(fā)表于 12-19 14:33

    不同頻率源如何給定頻率

    不同頻率源的頻率給定方式多種多樣,主要取決于變頻器的型號、功能和應(yīng)用場景。以下是些常見的頻率給定方式及其具體操作方法: 、面板給定 方式
    的頭像 發(fā)表于 09-25 17:26 ?1212次閱讀

    變頻器的頻率給定方式有幾種

    景。 1. 模擬電壓給定 模擬電壓給定是變頻器最常用的頻率給定方式之。它通過模擬電壓信號
    的頭像 發(fā)表于 09-25 17:22 ?2335次閱讀

    介紹FIR濾波模型建立,分4步驟

    本帖介紹FIR濾波模型建立,分以下幾個步驟: 選定濾波結(jié)構(gòu):低通、高通、帶通、帶阻; 選定合適的窗函數(shù),常見的有hamming、hanning、blackman、ExactBlackman
    發(fā)表于 09-04 09:08

    請問如何建立XTR110KU的Spice模型?

    怎么建立XTR110KU的Spice模型
    發(fā)表于 09-02 06:11

    NVIDIA Modulus助力風(fēng)阻預(yù)測模型實現(xiàn)

    NVIDIA 與百度飛槳雙方技術(shù)團隊通過在數(shù)據(jù)、算法、模型等多個方面的合作,共同打造了款適用于車輛空氣動力學(xué)數(shù)值模擬的 3D 高精度汽車風(fēng)阻預(yù)測模型——DNNFluid-Car。經(jīng)過
    的頭像 發(fā)表于 08-23 17:10 ?1413次閱讀

    談FPGA設(shè)計中的功率計算

    計算器。 有完整的系統(tǒng)級理解和精確的功率模型將能使設(shè)計師作出必要的決擇,從而完成設(shè)計。然后,設(shè)計者可以集中精力于降低功耗,其中包括以下幾個方面: 降低設(shè)備的工作電壓 優(yōu)化時鐘頻率
    發(fā)表于 07-31 22:37