資料介紹
針對傳統(tǒng)的主動學(xué)習(xí)算法只能處理中小型數(shù)據(jù)集的問題,提出一種基于MapReduce的大數(shù)據(jù)主動學(xué)習(xí)算法。首先,在有類別標(biāo)簽的初始訓(xùn)練集上,用極限學(xué)習(xí)機(jī)( ELM)算法訓(xùn)練一個分類器,并將其輸出用軟最大化函數(shù)變換為一個后驗概率分布。然后,將無類別標(biāo)簽的大數(shù)據(jù)集劃分為Z個子集,并部署到Z個云計算節(jié)點(diǎn)上。在每一個節(jié)點(diǎn),用訓(xùn)練出的分類器并行地計算各個子集中樣例的信息熵,并選擇信息熵大的前q個樣例進(jìn)行類別標(biāo)注,將標(biāo)注類別的Z×q個樣例添加到有類別標(biāo)簽的訓(xùn)練集中。重復(fù)以上步驟直到滿足預(yù)定義的停止條件。在Artificial、Skin、Statlog和Poker 4個數(shù)據(jù)集上與基于ELM的主動學(xué)習(xí)算法進(jìn)行了比較,結(jié)果顯示,所提算法在4個數(shù)據(jù)集上均能完成主動樣例選擇,而基于ELM的主動學(xué)習(xí)算法只在規(guī)模最小的數(shù)據(jù)集上能完成主動樣例選擇。實驗結(jié)果表明,所提算法優(yōu)于基于極限學(xué)習(xí)機(jī)的主動學(xué)習(xí)算法。

大數(shù)據(jù)具有以下幾個特征:海量( Volume)、多模態(tài)(Variety)、變化速度快(Velocity)、蘊(yùn)含價值高(Value)和可靠性高( Veracity)。在大數(shù)據(jù)環(huán)境下,傳統(tǒng)的機(jī)器學(xué)習(xí)面臨著巨大的挑戰(zhàn),其中也包括主動學(xué)習(xí)。主動學(xué)習(xí)算法大致可以分為兩大類:基于池的主動學(xué)習(xí)算法和基于流的主動學(xué)習(xí)算法。
- 大數(shù)據(jù)環(huán)境下的移動學(xué)習(xí)發(fā)展趨勢 21次下載
- 基于MapReduce的時間序列索引及數(shù)據(jù)查詢 7次下載
- 車聯(lián)網(wǎng)場景下汽車大數(shù)據(jù)應(yīng)用模式綜述 13次下載
- 一種改進(jìn)的主動標(biāo)記分布學(xué)習(xí)算法 7次下載
- 一種改進(jìn)的主動標(biāo)記分布學(xué)習(xí)算法 7次下載
- 一種面向MapReduce的中間數(shù)據(jù)傳輸流水線優(yōu)化機(jī)制 4次下載
- 基于MapReduce和加權(quán)網(wǎng)絡(luò)信息熵的DBWGIE-MR算法 11次下載
- SDR 主動學(xué)習(xí)模塊
- 基于MapReduce/Spark的大規(guī)模壓縮模糊K-近鄰算法 5次下載
- 大數(shù)據(jù)時代有什么樣的利與弊 11次下載
- 大數(shù)據(jù)環(huán)境下的移動學(xué)習(xí)發(fā)展是怎么樣的 0次下載
- 水文大數(shù)據(jù)標(biāo)準(zhǔn)化方法和水文大數(shù)據(jù)共享平臺關(guān)鍵技術(shù)的設(shè)計和資料概述 12次下載
- 如何使用Q學(xué)習(xí)算法進(jìn)行X光主動視覺的安檢方法資料說明概述 2次下載
- 面向并行迭代的MapReduce模型 1次下載
- 基于PRank算法的主動排序學(xué)習(xí)算法
- 學(xué)習(xí)大數(shù)據(jù)前必須知道的知識 3.1k次閱讀
- 零基礎(chǔ)可以學(xué)習(xí)大數(shù)據(jù)開發(fā)嗎?學(xué)什么內(nèi)容? 4k次閱讀
- 大數(shù)據(jù)技術(shù)發(fā)展史簡介 淺談大數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí) 7.9k次閱讀
- 大數(shù)據(jù)技術(shù)如何進(jìn)行融合發(fā)展 9.9k次閱讀
- 視覺大數(shù)據(jù)領(lǐng)域的最好分析方法之一:深度學(xué)習(xí) 5.4k次閱讀
- 大數(shù)據(jù)是什么_大數(shù)據(jù)技術(shù)和應(yīng)用的現(xiàn)狀與前景 2.5w次閱讀
- java工程師有必要轉(zhuǎn)做大數(shù)據(jù)嗎大數(shù)據(jù)學(xué)習(xí)路線你了解嗎 8k次閱讀
- 大數(shù)據(jù)產(chǎn)業(yè)生態(tài)聯(lián)盟的中國大數(shù)據(jù)產(chǎn)業(yè)發(fā)展白皮書 6.2k次閱讀
- 大數(shù)據(jù)分析到底需要多少種工具_(dá)大數(shù)據(jù)分析總結(jié) 1.2w次閱讀
- mapreduce二次排序_ mapreduce二次排序原理 6.6k次閱讀
- mapreduce的應(yīng)用開發(fā)步驟 5.1k次閱讀
- 詳解MapReduce的模式、算法和用例 7.5k次閱讀
- mapreduce編程實例 1.7w次閱讀
- 什么是mapreduce_mapreduce工作原理_mapreduce_mapreduce邏輯模型圖 2.6w次閱讀
- 機(jī)器學(xué)習(xí)究竟如何促進(jìn)大數(shù)據(jù)管理的革命以及解決問題而采取的行動 3.6k次閱讀
下載排行
本周
- 1MDD品牌三極管BC807數(shù)據(jù)手冊
- 3.00 MB | 次下載 | 免費(fèi)
- 2MDD品牌三極管BC817數(shù)據(jù)手冊
- 2.51 MB | 次下載 | 免費(fèi)
- 3MDD品牌三極管D882數(shù)據(jù)手冊
- 3.49 MB | 次下載 | 免費(fèi)
- 4MDD品牌三極管MMBT2222A數(shù)據(jù)手冊
- 3.26 MB | 次下載 | 免費(fèi)
- 5MDD品牌三極管MMBTA56數(shù)據(jù)手冊
- 3.09 MB | 次下載 | 免費(fèi)
- 6MDD品牌三極管MMBTA92數(shù)據(jù)手冊
- 2.32 MB | 次下載 | 免費(fèi)
- 7STM32G474 HRTIME PWM 丟波問題分析與解決
- 1.00 MB | 次下載 | 3 積分
- 8新能源電動汽車高壓線束的銅鋁連接解決方案
- 2.71 MB | 次下載 | 2 積分
本月
- 1愛華AIWA HS-J202維修手冊
- 3.34 MB | 37次下載 | 免費(fèi)
- 2PC5502負(fù)載均流控制電路數(shù)據(jù)手冊
- 1.63 MB | 23次下載 | 免費(fèi)
- 3NB-IoT芯片廠商的資料說明
- 0.31 MB | 22次下載 | 1 積分
- 4H110主板CPU PWM芯片ISL95858HRZ-T核心供電電路圖資料
- 0.63 MB | 6次下載 | 1 積分
- 5UWB653Pro USB口測距通信定位模塊規(guī)格書
- 838.47 KB | 5次下載 | 免費(fèi)
- 6技嘉H110主板IT8628E_BX IO電路圖資料
- 2.61 MB | 4次下載 | 1 積分
- 7蘇泊爾DCL6907(即CHK-S007)單芯片電磁爐原理圖資料
- 0.04 MB | 4次下載 | 1 積分
- 8蘇泊爾DCL6909(即CHK-S009)單芯片電磁爐原理圖資料
- 0.08 MB | 2次下載 | 1 積分
總榜
- 1matlab軟件下載入口
- 未知 | 935137次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計
- 1.48MB | 420064次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233089次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191439次下載 | 10 積分
- 5十天學(xué)會AVR單片機(jī)與C語言視頻教程 下載
- 158M | 183353次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81602次下載 | 10 積分
- 7Keil工具M(jìn)DK-Arm免費(fèi)下載
- 0.02 MB | 73822次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65991次下載 | 10 積分
電子發(fā)燒友App





創(chuàng)作
發(fā)文章
發(fā)帖
提問
發(fā)資料
發(fā)視頻
上傳資料賺積分
評論