chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于無(wú)監(jiān)督學(xué)習(xí)和圖學(xué)習(xí)的大數(shù)據(jù)挖掘

1ujk_Tencent_TE ? 來(lái)源:騰訊技術(shù)工程官方號(hào) ? 2019-12-08 10:57 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在IJCAI-2019期間舉辦的騰訊TAIC晚宴和Booth Talk中,來(lái)自TEG數(shù)據(jù)平臺(tái)的張長(zhǎng)旺向大家介紹了自己所在用戶畫(huà)像組的前沿科研結(jié)果:

1. 非監(jiān)督短文本層級(jí)分類;

2. 大規(guī)模復(fù)雜網(wǎng)絡(luò)挖掘和圖表示學(xué)習(xí)。

其所在團(tuán)隊(duì)積極與學(xué)術(shù)界科研合作,并希望有夢(mèng)想、愛(ài)學(xué)習(xí)的實(shí)力派加入,共同研究和應(yīng)用半監(jiān)督/弱監(jiān)督/無(wú)監(jiān)督學(xué)習(xí)、小樣本學(xué)習(xí)、大規(guī)模復(fù)雜網(wǎng)絡(luò)挖掘和圖表示學(xué)習(xí)等做大數(shù)據(jù)挖掘。

科研結(jié)果1:非監(jiān)督短文本層級(jí)分類

首先以下用戶和AI算法的對(duì)話,顯示了現(xiàn)實(shí)業(yè)務(wù)中使用現(xiàn)有監(jiān)督文本分類算法的遇到的一些困境和問(wèn)題:

算法需要海量訓(xùn)練數(shù)據(jù)

算法模型用戶不可控

算法不能很好的適應(yīng)類目的變化

我們分析現(xiàn)有監(jiān)督算法的主要問(wèn)題在于沒(méi)有真正的知識(shí), 沒(méi)有對(duì)于文本和類目的真正的理解。現(xiàn)有算法只是在學(xué)習(xí)大量人工標(biāo)注訓(xùn)練樣本里面的模式。為了解決這個(gè)問(wèn)題,我們啟動(dòng)了一個(gè)叫做: 基于關(guān)鍵詞知識(shí)與類目知識(shí)的非監(jiān)督短文本層級(jí)分類的探索項(xiàng)目。

項(xiàng)目的主要思想是引入關(guān)鍵詞和類目?jī)煞N知識(shí)來(lái)幫助算法理解關(guān)鍵詞和類目的含義。然后基于知識(shí)進(jìn)行文本的分類和標(biāo)注。關(guān)鍵詞知識(shí)主要來(lái)自3個(gè)方面包括:關(guān)鍵詞的網(wǎng)絡(luò)搜索上下文、關(guān)鍵詞的百科上下文、關(guān)鍵詞到類目詞的后驗(yàn)關(guān)聯(lián)概率。我們提出類目語(yǔ)義表達(dá)式來(lái)支持用戶表達(dá)豐富的類目本身和類目之間的關(guān)系的語(yǔ)義。這兩樣知識(shí)的引入幫助算法擺脫了對(duì)于大量人工標(biāo)注訓(xùn)練樣本的依賴,同時(shí)算法分類的過(guò)程做到了人工可理解,人工可控制。

pIYBAF3sZiCAD0NcAAGXC_cWyhc920.jpg

基于關(guān)鍵詞和類目知識(shí)的無(wú)監(jiān)督文本層級(jí)分類算法流程如下:

對(duì)文本提取關(guān)鍵詞

根據(jù)關(guān)鍵詞知識(shí)計(jì)算關(guān)鍵詞到類目詞的相關(guān)度詞向量

根據(jù)關(guān)鍵詞的相關(guān)度詞向量計(jì)算文本的相關(guān)度詞向量

根據(jù)文本的相關(guān)度詞向量和類目語(yǔ)義表達(dá)式計(jì)算文本與每個(gè)類目的匹配度

每個(gè)文本被分為與之匹配度最高的類目

pIYBAF3sZiCAc4I1AAFF-PRpshM196.jpg

通過(guò)在兩個(gè)文本分類數(shù)據(jù)集合上面的實(shí)驗(yàn),我們發(fā)現(xiàn),我們自研的算法能夠在沒(méi)有訓(xùn)練樣本的情況下提供質(zhì)量可用的結(jié)果,其一級(jí)類目準(zhǔn)確率能夠達(dá)到80%,并且明顯高于現(xiàn)有其他非監(jiān)督算法。

pIYBAF3sZiCAPnfmAAGamuFnOPU555.jpg

科研結(jié)果2:大規(guī)模復(fù)雜網(wǎng)絡(luò)挖掘和圖表示學(xué)習(xí)

Network Representation Learning 或者說(shuō) Graph Embedding 是復(fù)雜網(wǎng)絡(luò)最新的研究課題,意在通過(guò)神經(jīng)網(wǎng)絡(luò)模型,把圖結(jié)構(gòu)向量化,為節(jié)點(diǎn)分類、鏈路預(yù)測(cè)、社團(tuán)發(fā)現(xiàn)等挖掘任務(wù)提供方便有效的特征,以克服圖結(jié)構(gòu)難以應(yīng)用到機(jī)器學(xué)習(xí)算法中的難題。

本次我們?cè)贗JCAI發(fā)表的學(xué)術(shù)論文“Identifying Illicit Accounts in Large Scale E-payment Networks - A Graph Representation Learning Approach”創(chuàng)新性提出結(jié)合邊屬性的圖卷積神經(jīng)網(wǎng)絡(luò)模型,彌補(bǔ)了現(xiàn)有算法無(wú)法利用邊屬性為節(jié)點(diǎn)分類提供更多信息的不足。

pIYBAF3sZiCAf4jWAADyry40GSc801.jpg

現(xiàn)有的圖學(xué)習(xí)算法,絕大部分都忽視了邊上信息的價(jià)值。在這里我們提出了一種可以把邊的信息傳輸?shù)焦?jié)點(diǎn)表示結(jié)果的改進(jìn)的GCN算法。算法主要思路是在做GCN里面周邊鄰居節(jié)點(diǎn)向量的聚合計(jì)算之前,把每個(gè)節(jié)點(diǎn)連接邊的Embedding向量拼接在對(duì)應(yīng)鄰居節(jié)點(diǎn)的Embedding向量后面。實(shí)驗(yàn)顯示,我們的算法對(duì)于金融分類問(wèn)題具有更優(yōu)的結(jié)果。我們團(tuán)隊(duì)正在進(jìn)一步優(yōu)化模型,正在研發(fā)利用時(shí)序的GCN模型,以可以利用邊的時(shí)序交互信息,從而更好的表示動(dòng)態(tài)網(wǎng)絡(luò)。

pIYBAF3sZiGAcZ4XAAGfvV5Mbk0987.jpg

pIYBAF3sZiGAVDl_AAEtrHfo7Kk905.jpg

同時(shí),數(shù)平數(shù)據(jù)中心研發(fā)的Angel參數(shù)服務(wù)器平臺(tái),針對(duì)關(guān)系型數(shù)據(jù)結(jié)構(gòu),在計(jì)算性能上對(duì)圖算法做了優(yōu)化,極大加速了PageRank等算法的計(jì)算速度,比如計(jì)算用戶中心度的Closeness算法,性能比基于Spark GraphX的算法提升了6.7倍。下圖顯示對(duì)于大型圖的計(jì)算,我們Angle框架的速度具有明顯的優(yōu)勢(shì)。

pIYBAF3sZiGANHYUAAEl0_C2wBk224.jpg

pIYBAF3sZiGAXUHmAAEim4GgRxY047.jpg

我們所在團(tuán)隊(duì)積極與學(xué)術(shù)界科研合作,并希望有夢(mèng)想、愛(ài)學(xué)習(xí)的實(shí)力派加入,共同研究和應(yīng)用半監(jiān)督/弱監(jiān)督/無(wú)監(jiān)督學(xué)習(xí)、小樣本學(xué)習(xí)、復(fù)雜網(wǎng)絡(luò)挖掘和圖表示學(xué)習(xí)做大數(shù)據(jù)挖掘。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4743

    瀏覽量

    96904
  • 大數(shù)據(jù)
    +關(guān)注

    關(guān)注

    64

    文章

    8998

    瀏覽量

    142650

原文標(biāo)題:IJCAI2019報(bào)告:基于無(wú)監(jiān)督學(xué)習(xí)和圖學(xué)習(xí)的大數(shù)據(jù)挖掘

文章出處:【微信號(hào):Tencent_TEG,微信公眾號(hào):騰訊技術(shù)工程官方號(hào)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    自動(dòng)駕駛中常提的“強(qiáng)化學(xué)習(xí)”是個(gè)啥?

    下,就是一個(gè)智能體在環(huán)境里行動(dòng),它能觀察到環(huán)境的一些信息,并做出一個(gè)動(dòng)作,然后環(huán)境會(huì)給出一個(gè)反饋(獎(jiǎng)勵(lì)或懲罰),智能體的目標(biāo)是把長(zhǎng)期得到的獎(jiǎng)勵(lì)累積到最大。和監(jiān)督學(xué)習(xí)不同,強(qiáng)化學(xué)習(xí)沒(méi)有一一對(duì)應(yīng)的“正確答案”給它看,而是靠與環(huán)境交互、自我探索來(lái)發(fā)現(xiàn)
    的頭像 發(fā)表于 10-23 09:00 ?168次閱讀
    自動(dòng)駕駛中常提的“強(qiáng)化<b class='flag-5'>學(xué)習(xí)</b>”是個(gè)啥?

    學(xué)習(xí)物聯(lián)網(wǎng)可以做什么工作?

    健康、智能制造等領(lǐng)域。以下是一些常見(jiàn)的職業(yè)方向: 物聯(lián)網(wǎng)工程師:從事物聯(lián)網(wǎng)系統(tǒng)的設(shè)計(jì)、開(kāi)發(fā)、測(cè)試、維護(hù)和升級(jí)等工作,包括傳感器、無(wú)線通信、云計(jì)算、大數(shù)據(jù)等技術(shù)的應(yīng)用。   嵌入式軟件工程師:負(fù)責(zé)開(kāi)發(fā)
    發(fā)表于 10-11 16:40

    XKCON祥控輸煤皮帶智能機(jī)器人巡檢系統(tǒng)對(duì)監(jiān)測(cè)數(shù)據(jù)進(jìn)行挖掘分析

    XKCON祥控輸煤皮帶智能機(jī)器人巡檢系統(tǒng)通過(guò)智能機(jī)器人在皮帶運(yùn)行過(guò)程中對(duì)皮帶的運(yùn)行狀態(tài)和環(huán)境狀況進(jìn)行實(shí)時(shí)檢測(cè),在應(yīng)用過(guò)程中,不但提升了巡視周期頻次,還通過(guò)大數(shù)據(jù)分析和深度學(xué)習(xí)算法,對(duì)監(jiān)測(cè)數(shù)據(jù)進(jìn)行
    的頭像 發(fā)表于 09-15 11:22 ?297次閱讀
    XKCON祥控輸煤皮帶智能機(jī)器人巡檢系統(tǒng)對(duì)監(jiān)測(cè)<b class='flag-5'>數(shù)據(jù)</b>進(jìn)行<b class='flag-5'>挖掘</b>分析

    任正非說(shuō) AI已經(jīng)確定是第四次工業(yè)革命 那么如何從容地加入進(jìn)來(lái)呢?

    的基本理論。了解監(jiān)督學(xué)習(xí)無(wú)監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)的基本原理。例如,在監(jiān)督學(xué)習(xí)中,理解如何通過(guò)標(biāo)注數(shù)據(jù)
    發(fā)表于 07-08 17:44

    機(jī)器學(xué)習(xí)異常檢測(cè)實(shí)戰(zhàn):用Isolation Forest快速構(gòu)建無(wú)標(biāo)簽異常檢測(cè)系統(tǒng)

    本文轉(zhuǎn)自:DeepHubIMBA無(wú)監(jiān)督異常檢測(cè)作為機(jī)器學(xué)習(xí)領(lǐng)域的重要分支,專門(mén)用于在缺乏標(biāo)記數(shù)據(jù)的環(huán)境中識(shí)別異常事件。本文深入探討異常檢測(cè)技術(shù)的理論基礎(chǔ)與實(shí)踐應(yīng)用,通過(guò)Isolatio
    的頭像 發(fā)表于 06-24 11:40 ?1067次閱讀
    機(jī)器<b class='flag-5'>學(xué)習(xí)</b>異常檢測(cè)實(shí)戰(zhàn):用Isolation Forest快速構(gòu)建<b class='flag-5'>無(wú)</b>標(biāo)簽異常檢測(cè)系統(tǒng)

    使用MATLAB進(jìn)行無(wú)監(jiān)督學(xué)習(xí)

    無(wú)監(jiān)督學(xué)習(xí)是一種根據(jù)未標(biāo)注數(shù)據(jù)進(jìn)行推斷的機(jī)器學(xué)習(xí)方法。無(wú)監(jiān)督學(xué)習(xí)旨在識(shí)別
    的頭像 發(fā)表于 05-16 14:48 ?1051次閱讀
    使用MATLAB進(jìn)行<b class='flag-5'>無(wú)</b><b class='flag-5'>監(jiān)督學(xué)習(xí)</b>

    大數(shù)據(jù)與云計(jì)算是干嘛的?

    大數(shù)據(jù)與云計(jì)算是支撐現(xiàn)代數(shù)字化技術(shù)的兩大核心。大數(shù)據(jù)專注于海量數(shù)據(jù)的采集、存儲(chǔ)、分析與價(jià)值挖掘;云計(jì)算通過(guò)虛擬化資源池提供彈性計(jì)算、存儲(chǔ)及服務(wù)能力。兩者結(jié)合,共同賦能企業(yè)決策、業(yè)務(wù)創(chuàng)新
    的頭像 發(fā)表于 02-20 14:48 ?1124次閱讀

    傳統(tǒng)機(jī)器學(xué)習(xí)方法和應(yīng)用指導(dǎo)

    用于開(kāi)發(fā)生物學(xué)數(shù)據(jù)的機(jī)器學(xué)習(xí)方法。盡管深度學(xué)習(xí)(一般指神經(jīng)網(wǎng)絡(luò)算法)是一個(gè)強(qiáng)大的工具,目前也非常流行,但它的應(yīng)用領(lǐng)域仍然有限。與深度學(xué)習(xí)相比,傳統(tǒng)方法在給定問(wèn)題上的開(kāi)發(fā)和測(cè)試速度更快。
    的頭像 發(fā)表于 12-30 09:16 ?1663次閱讀
    傳統(tǒng)機(jī)器<b class='flag-5'>學(xué)習(xí)</b>方法和應(yīng)用指導(dǎo)

    什么是機(jī)器學(xué)習(xí)?通過(guò)機(jī)器學(xué)習(xí)方法能解決哪些問(wèn)題?

    計(jì)算機(jī)系統(tǒng)自身的性能”。事實(shí)上,由于“經(jīng)驗(yàn)”在計(jì)算機(jī)系統(tǒng)中主要以數(shù)據(jù)的形式存在,因此機(jī)器學(xué)習(xí)需要設(shè)法對(duì)數(shù)據(jù)進(jìn)行分析學(xué)習(xí),這就使得它逐漸成為智能數(shù)據(jù)
    的頭像 發(fā)表于 11-16 01:07 ?1389次閱讀
    什么是機(jī)器<b class='flag-5'>學(xué)習(xí)</b>?通過(guò)機(jī)器<b class='flag-5'>學(xué)習(xí)</b>方法能解決哪些問(wèn)題?

    時(shí)空引導(dǎo)下的時(shí)間序列自監(jiān)督學(xué)習(xí)框架

    【導(dǎo)讀】最近,香港科技大學(xué)、上海AI Lab等多個(gè)組織聯(lián)合發(fā)布了一篇時(shí)間序列無(wú)監(jiān)督預(yù)訓(xùn)練的文章,相比原來(lái)的TS2Vec等時(shí)間序列表示學(xué)習(xí)工作,核心在于提出了將空間信息融入到預(yù)訓(xùn)練階段,即在預(yù)訓(xùn)練階段
    的頭像 發(fā)表于 11-15 11:41 ?1094次閱讀
    時(shí)空引導(dǎo)下的時(shí)間序列自<b class='flag-5'>監(jiān)督學(xué)習(xí)</b>框架

    NPU與機(jī)器學(xué)習(xí)算法的關(guān)系

    在人工智能領(lǐng)域,機(jī)器學(xué)習(xí)算法是實(shí)現(xiàn)智能系統(tǒng)的核心。隨著數(shù)據(jù)量的激增和算法復(fù)雜度的提升,對(duì)計(jì)算資源的需求也在不斷增長(zhǎng)。NPU作為一種專門(mén)為深度學(xué)習(xí)等機(jī)器學(xué)習(xí)任務(wù)設(shè)計(jì)的處理器,其與機(jī)器
    的頭像 發(fā)表于 11-15 09:19 ?1716次閱讀

    NPU在深度學(xué)習(xí)中的應(yīng)用

    設(shè)計(jì)的硬件加速器,它在深度學(xué)習(xí)中的應(yīng)用日益廣泛。 1. NPU的基本概念 NPU是一種專門(mén)針對(duì)深度學(xué)習(xí)算法優(yōu)化的處理器,它與傳統(tǒng)的CPU和GPU有所不同。NPU通常具有高度并行的處理能力,能夠高效地執(zhí)行深度學(xué)習(xí)中的大規(guī)模矩陣運(yùn)算
    的頭像 發(fā)表于 11-14 15:17 ?2613次閱讀

    物聯(lián)網(wǎng)學(xué)習(xí)路線來(lái)啦!

    云平臺(tái)應(yīng)用技術(shù) 了解云計(jì)算的基本概念和服務(wù)模式,學(xué)習(xí)硬件設(shè)備如何入住云平臺(tái),并且如何利用云平臺(tái)進(jìn)行數(shù)據(jù)處理和分析。 掌握大數(shù)據(jù)處理技術(shù)和分析基本方法,為物聯(lián)網(wǎng)應(yīng)用提供數(shù)據(jù)支持。 6綜
    發(fā)表于 11-11 16:03

    如何使用 PyTorch 進(jìn)行強(qiáng)化學(xué)習(xí)

    的計(jì)算和自動(dòng)微分功能,非常適合實(shí)現(xiàn)復(fù)雜的強(qiáng)化學(xué)習(xí)算法。 1. 環(huán)境(Environment) 在強(qiáng)化學(xué)習(xí)中,環(huán)境是一個(gè)抽象的概念,它定義了智能體(agent)可以執(zhí)行的動(dòng)作(actions)、觀察到
    的頭像 發(fā)表于 11-05 17:34 ?1311次閱讀

    曙光公司成都云中心助力提升監(jiān)督質(zhì)效

    數(shù)字化時(shí)代,用好大數(shù)據(jù),推動(dòng)數(shù)字技術(shù)深度融入紀(jì)檢監(jiān)察各項(xiàng)業(yè)務(wù),是大勢(shì)所趨。當(dāng)前,各地正在探索推進(jìn)大數(shù)據(jù)監(jiān)督,借助海量數(shù)據(jù)、算力、算法,不斷延伸監(jiān)督
    的頭像 發(fā)表于 11-05 10:05 ?667次閱讀