資料介紹
時間序列聚類已成為近十年來越來越重要的研究課題。大多數(shù)現(xiàn)有的時間序列聚類方法依賴于使用歐幾里得距離或動態(tài)時間扭曲距離作為距離度量的整個原始數(shù)據(jù)計算出的距離。然而,存在顯著噪聲、輟學(xué)或外來數(shù)據(jù)會極大地限制該領(lǐng)域中聚類的準確性。此外,對于大多數(shù)現(xiàn)實世界問題,我們不能期望同一類中的對象長度相等。因此,大多數(shù)關(guān)于時間序列聚類的工作只考慮個體時間序列“行為”的聚類,例如個體心跳或個體步態(tài)周期,并以某種方式設(shè)計時間序列,使其長度相等。然而,以這種方式設(shè)計數(shù)據(jù)往往比集群本身更困難。
在這項工作中,我們表明,通過僅使用一些局部模式并故意忽略其余的數(shù)據(jù),我們可以緩解上述問題,并將不同長度的時間序列群集起來,即將一個心跳與多個心跳群集起來。為了實現(xiàn)這一點,我們利用并擴展了最近引入的時間序列數(shù)據(jù)挖掘概念shapelets。與現(xiàn)有的工作不同,我們的工作首次證明了shapelet可以從未標記的時間序列中學(xué)習(xí)這一非必然的事實。我們在不同領(lǐng)域進行了廣泛的實證評估,結(jié)果表明我們的方法比現(xiàn)有的方法更準確。此外,除了準確的聚類結(jié)果外,我們的工作還可以對其應(yīng)用領(lǐng)域進行深入了解。
時間序列分析是航天、金融、商業(yè)、氣象學(xué)、醫(yī)學(xué)、運動捕捉等許多研究領(lǐng)域的一個重要課題,然而,大多數(shù)時間序列分析的研究都受到昂貴的標記數(shù)據(jù)需求的限制。這導(dǎo)致人們對聚類時間序列數(shù)據(jù)越來越感興趣,根據(jù)定義,這些數(shù)據(jù)不需要訪問帶標簽的數(shù)據(jù)。
Keogh和Kasetty于年進行的一項長達十年的經(jīng)驗比較揭示了一個令人驚訝的事實,即簡單的歐幾里得距離度量與其他更復(fù)雜的距離度量具有高度的競爭性,而最近的研究證實了這一點。然而,要定義歐幾里得距離,時間序列必須是等長的。動態(tài)時間扭曲(DTW)既能解決這一問題,又能解決包含異相相似度的時間序列聚類困難的問題,如所示。
然而,在這項工作中,我們認為歐幾里得距離或DTW用于聚類的明顯效用可能來自于對UCR時間序列存檔的過度依賴,用于測試聚類算法。問題是,這個檔案中的數(shù)據(jù)已經(jīng)被手工編輯,以便具有相等的長度和(近似的)對齊方式。然而,以這種格式設(shè)計數(shù)據(jù)的任務(wù)幾乎肯定比為數(shù)據(jù)添加標簽(即集群本身)的任務(wù)更困難。
作為一個具體的例子,考慮到著名的槍點數(shù)據(jù)集,它已經(jīng)在成百上千的研究中被用于聚類和分類,在每種情況下都報告了近乎完美的準確度。這個數(shù)據(jù)集是通過聲音提示設(shè)計的,這兩種提示都向演員發(fā)出信號,并開始/停止錄像。圖1顯示了來自歸檔文件的兩個數(shù)據(jù)示例(只是用紅色/粗體突出顯示的部分);但是,通過檢查原始歸檔文件,我們能夠顯示UCR歸檔文件中使用的3秒繼續(xù)/跟蹤數(shù)據(jù)。
- 快速HAC聚類算法的改進及應(yīng)用于無監(jiān)督語音分割
- 基于動態(tài)分段的時間序列索引DSI 8次下載
- 基于成對學(xué)習(xí)和圖像聚類的肺癌亞型識別 4次下載
- 一種面向私有二進制協(xié)議的報文聚類方法 9次下載
- 時間序列的特征表示和相似性度量研究分析 40次下載
- 面向時序事件的動態(tài)矩陣聚類方法RDMC 8次下載
- 密度峰值聚類算法實現(xiàn)LGG的半監(jiān)督學(xué)習(xí) 21次下載
- 如何使用拉普拉斯中心性和密度峰值進行無參數(shù)聚類算法的研究 12次下載
- 如何使用空間鄰近搜索進行移動軌跡相對時間模式挖掘的方法資料說明 4次下載
- 基于主動學(xué)習(xí)先驗的半監(jiān)督K-means聚類算法 0次下載
- 矩陣弧微分的時間序列相似度量 11次下載
- 基于導(dǎo)數(shù)序列的時間序列同構(gòu)關(guān)系 0次下載
- 半監(jiān)督的譜聚類圖像分割 4次下載
- 基于模糊分組和監(jiān)督聚類的RBF回歸性能改進
- 半監(jiān)督聚類中基于密度的約束擴展方法
- 神經(jīng)網(wǎng)絡(luò)如何用無監(jiān)督算法訓(xùn)練 852次閱讀
- 深度學(xué)習(xí)中的無監(jiān)督學(xué)習(xí)方法綜述 854次閱讀
- 使用輪廓分數(shù)提升時間序列聚類的表現(xiàn) 587次閱讀
- 簡單時間輪算法詳解 2497次閱讀
- 一種新的無監(jiān)督時間序列異常檢測方法 2754次閱讀
- 10種聚類介紹和Python代碼 3156次閱讀
- 深度剖析時間復(fù)雜度 1910次閱讀
- 時間繼電器的簡述_時間繼電器的技術(shù)參數(shù) 7554次閱讀
- 時間繼電器的工作原理_時間繼電器的分類 1.1w次閱讀
- 如何利用51單片機內(nèi)部定時器實現(xiàn)對時間的操作 3.7w次閱讀
- 谷歌大腦在構(gòu)建源代碼生成模型上實現(xiàn)了新突破! 2145次閱讀
- Python無監(jiān)督學(xué)習(xí)的幾種聚類算法包括K-Means聚類,分層聚類等詳細概述 3w次閱讀
- 淺談Matlab中的聚類分析 Matlab聚類程序的設(shè)計 7383次閱讀
- 基于密度DBSCAN的聚類算法 2.1w次閱讀
- k means聚類算法實例 1.5w次閱讀
下載排行
本周
- 1TC358743XBG評估板參考手冊
- 1.36 MB | 330次下載 | 免費
- 2開關(guān)電源基礎(chǔ)知識
- 5.73 MB | 11次下載 | 免費
- 3嵌入式linux-聊天程序設(shè)計
- 0.60 MB | 3次下載 | 免費
- 4DIY動手組裝LED電子顯示屏
- 0.98 MB | 3次下載 | 免費
- 5基于FPGA的C8051F單片機開發(fā)板設(shè)計
- 0.70 MB | 2次下載 | 免費
- 651單片機窗簾控制器仿真程序
- 1.93 MB | 2次下載 | 免費
- 751單片機大棚環(huán)境控制器仿真程序
- 1.10 MB | 2次下載 | 免費
- 8基于51單片機的RGB調(diào)色燈程序仿真
- 0.86 MB | 2次下載 | 免費
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費
- 2555集成電路應(yīng)用800例(新編版)
- 0.00 MB | 33566次下載 | 免費
- 3接口電路圖大全
- 未知 | 30323次下載 | 免費
- 4開關(guān)電源設(shè)計實例指南
- 未知 | 21549次下載 | 免費
- 5電氣工程師手冊免費下載(新編第二版pdf電子書)
- 0.00 MB | 15349次下載 | 免費
- 6數(shù)字電路基礎(chǔ)pdf(下載)
- 未知 | 13750次下載 | 免費
- 7電子制作實例集錦 下載
- 未知 | 8113次下載 | 免費
- 8《LED驅(qū)動電路設(shè)計》 溫德爾著
- 0.00 MB | 6656次下載 | 免費
總榜
- 1matlab軟件下載入口
- 未知 | 935054次下載 | 免費
- 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
- 78.1 MB | 537798次下載 | 免費
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420027次下載 | 免費
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費
- 6電路仿真軟件multisim 10.0免費下載
- 340992 | 191186次下載 | 免費
- 7十天學(xué)會AVR單片機與C語言視頻教程 下載
- 158M | 183279次下載 | 免費
- 8proe5.0野火版下載(中文版免費下載)
- 未知 | 138040次下載 | 免費
評論