chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

用PCA還是LDA?特征抽取經(jīng)典算法大PK

格創(chuàng)東智 ? 2019-01-10 13:40 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在之前的格物匯文章中,我們介紹了特征抽取的經(jīng)典算法——主成分分析(PCA),了解了PCA算法實質(zhì)上是進行了一次坐標軸旋轉(zhuǎn),盡可能讓數(shù)據(jù)映射在新坐標軸方向上的方差盡可能大,并且讓原數(shù)據(jù)與新映射的數(shù)據(jù)在距離的變化上盡可能小。方差較大的方向代表數(shù)據(jù)含有的信息量較大,建議保留。方差較小的方向代表數(shù)據(jù)含有的信息量較少,建議舍棄。今天我們就來看一下PCA的具體應用案例和特征映射的另一種方法:線性判別分析(LDA)


PCA案例

機器學習中,所使用的數(shù)據(jù)往往維數(shù)很大,我們需要使用降維的方法來突顯信息含量較大的數(shù)據(jù),PCA就是一個很好的降維方法。下面我們來看一個具體的應用案例,為了簡單起見,我們使用一個較小的數(shù)據(jù)集來展示:


1.jpg


顯而易見,我們數(shù)據(jù)有6維,維數(shù)雖然不是很多但不一定代表數(shù)據(jù)不可以降維。我們使用sklearn中的PCA算法擬合數(shù)據(jù)集得到如下的結果:


2.jpg

我們可以看到經(jīng)過PCA降維后依然生成了新的6個維度,但是數(shù)據(jù)映射在每一個維度上的方差大小不一樣。我們會對每一個維度上的方差進行歸一化,每一個維度上的方差量我們稱為可解釋的方差量(Explained Variance)。由圖可知,每一個維度上可解釋方差占比為:0.4430,0.2638,0.1231,0.1012,0.0485,0.0204。根據(jù)經(jīng)驗來說我們期望可解釋的方差量累計值在80%以上較好,因此我們可以選擇降維降到3維(82.99%)或者4維(93.11%),括號中的數(shù)字為累計可解釋的方差量,最后兩維方差解釋只有7%不到,建議舍去。圖中的柱狀圖表示原維度在新坐標軸上的映射向量大小。在前兩維度上表現(xiàn)如下圖所示:

3.jpg

PCA雖然能實現(xiàn)很好的降維效果,但是它卻是一種無監(jiān)督的方法。實際上我們更加希望對于有類別標簽的數(shù)據(jù)(有監(jiān)督),也能實現(xiàn)降維,并且降維后能更好的區(qū)分每一個類。此時,特征抽取的另一種經(jīng)典算法——線性判別分析(LDA)就閃亮登場了。

LDA簡介

LDA是一種監(jiān)督學習的降維技術,也就是說它的數(shù)據(jù)集的每個樣本是有類別輸出的。這點和PCA不同。PCA是不考慮樣本類別輸出的無監(jiān)督降維技術。LDA的思想可以用一句話概括,就是“投影后類內(nèi)方差最小,類間方差最大”。什么意思呢? 我們要將數(shù)據(jù)在低維度上進行投影,投影后希望每一種類別數(shù)據(jù)的投影點盡可能的接近,而不同類別的數(shù)據(jù)的類別中心之間的距離盡可能的大。

4.jpg


上圖中提供了兩種投影方式,哪一種能更好的滿足我們的標準呢?從直觀上可以看出,右圖要比左圖的投影效果好,因為右圖的黑色數(shù)據(jù)和藍色數(shù)據(jù)各個較為集中,且類別之間的距離明顯。左圖則在邊界處數(shù)據(jù)混雜。LDA的降維效果更像右圖,它能在新坐標軸上優(yōu)先區(qū)分出兩個類別,它是如何實現(xiàn)的呢?

LDA的原理

LDA的主要思想是“投影后類內(nèi)方差最小,類間方差最大”。實質(zhì)上就是很好的區(qū)分出兩個類的分布。我們知道衡量數(shù)據(jù)分布的兩個重要指標是均值和方差,對于每一個類,他們的定義如下:

5.jpg

與PCA一樣,LDA也是對數(shù)據(jù)的坐標軸進行一次旋轉(zhuǎn),假設旋轉(zhuǎn)的轉(zhuǎn)移矩陣是w,那么新的旋轉(zhuǎn)數(shù)據(jù)可以表示為:

6.jpg

同理,兩個類別的中心點也轉(zhuǎn)換成了:

7.jpg


文字.jpg


8.jpg


我們求解這個最優(yōu)化問題,即可求出轉(zhuǎn)移變換矩陣w,即LDA的最終結果。


PCA vs LDA

LDA用于降維,和PCA有很多相同,也有很多不同的地方,因此值得好好的比較一下兩者的降維異同點。首先我們看看相同點:

1、兩者均可以對數(shù)據(jù)進行降維

2、兩者在降維時均使用了矩陣特征分解的思想

3、兩者都假設數(shù)據(jù)符合高斯分布


我們接著看看不同點:

1、LDA是有監(jiān)督的降維方法,而PCA是無監(jiān)督的降維方法

2、LDA降維最多降到類別數(shù)k-1的維數(shù),而PCA沒有這個限制

3、LDA除了可以用于降維,還可以用于分類

4、LDA選擇分類性能最好的投影方向,而PCA選擇樣本點投影具有最大方差的方向


在某些數(shù)據(jù)分布下LDA比PCA降維較優(yōu)(左圖),在某些數(shù)據(jù)分布下,PCA比LDA降維較優(yōu)。

9.jpg


好了,以上就是本期格物匯的內(nèi)容,我們下期見。


本文作者:格創(chuàng)東智 OT團隊(轉(zhuǎn)載請注明作者及來源)



聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 物聯(lián)網(wǎng)

    關注

    2945

    文章

    47820

    瀏覽量

    415020
  • PCA
    PCA
    +關注

    關注

    0

    文章

    91

    瀏覽量

    30957
  • LDA
    LDA
    +關注

    關注

    0

    文章

    30

    瀏覽量

    11007
  • 智能制造
    +關注

    關注

    48

    文章

    6236

    瀏覽量

    79939
  • 工業(yè)互聯(lián)網(wǎng)

    關注

    28

    文章

    4394

    瀏覽量

    96272
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    算法工程師需要具備哪些技能?

    算法工程師需要掌握一系列跨學科的技能,涵蓋數(shù)學基礎、編程能力、算法理論、工程實踐以及業(yè)務理解等多個方面。 以下是具體技能及學習建議: 線性代數(shù)核心內(nèi)容:矩陣運算、特征值分解、向量空間等。應用場
    發(fā)表于 02-27 10:53

    探索PCA9547:8通道I2C總線復用器的設計奧秘

    探索PCA9547:8通道I2C總線復用器的設計奧秘 在電子設計領域,I2C總線是一種廣泛應用的通信協(xié)議,而PCA9547作為一款8通道I2C總線復用器,為我們在多設備通信中提供了強大的解決方案
    的頭像 發(fā)表于 02-26 17:45 ?1005次閱讀

    探索PCA9665/PCA9665A:Fm+并行總線到I2C總線控制器的深度解析

    探索PCA9665/PCA9665A:Fm+并行總線到I2C總線控制器的深度解析 在電子設計領域,總線控制器扮演著至關重要的角色,它能夠?qū)崿F(xiàn)不同類型總線之間的通信,為系統(tǒng)的集成和擴展提供了強大的支持
    的頭像 發(fā)表于 01-29 15:00 ?174次閱讀

    PID控制的算法

    當中,PID控制算法又是最簡單,最能體現(xiàn)反饋思想的控制算法,可謂經(jīng)典中的經(jīng)典。經(jīng)典的未必是復雜的,經(jīng)典
    發(fā)表于 01-23 08:18

    中斷還是輪詢?嵌入式外設驅(qū)動的最佳實踐!

    剛?cè)腴T做嵌入式開發(fā)時,很多人經(jīng)常糾結:定時器采集傳感器數(shù)據(jù),是直接while循環(huán)里輪詢標志位,還是寫個中斷函數(shù)?串口收發(fā)數(shù)據(jù)時,是while(!(USART_SR&RXNE))這種
    的頭像 發(fā)表于 01-04 09:15 ?382次閱讀
    中斷<b class='flag-5'>還是</b>輪詢?嵌入式外設驅(qū)動的最佳實踐!

    PCA9545A:低電壓4通道I2C和SMBus開關的深度解析

    PCA9545A:低電壓4通道I2C和SMBus開關的深度解析 引言 在電子設計領域,I2C和SMBus接口的應用極為廣泛。PCA9545A作為一款低電壓4通道I2C和SMBus開關,憑借其出色
    的頭像 發(fā)表于 12-29 09:30 ?370次閱讀

    PCA9548A:低電壓8通道I2C開關的技術解析與應用指南

    PCA9548A:低電壓8通道I2C開關的技術解析與應用指南 在電子設計領域,I2C總線的應用極為廣泛,而PCA9548A作為一款低電壓8通道I2C開關,為解決I2C總線應用中的諸多問題提供了有效
    的頭像 發(fā)表于 12-27 09:45 ?850次閱讀

    PCA9543A:2通道I2C總線開關的深度解析與應用指南

    PCA9543A:2通道I2C總線開關的深度解析與應用指南 在電子設計領域,I2C總線的應用極為廣泛,而PCA9543A作為一款2通道I2C總線開關,憑借其獨特的性能和豐富的功能,在眾多應用場景中發(fā)
    的頭像 發(fā)表于 12-26 11:30 ?440次閱讀

    PCA9617ADP - ARD評估板:功能、配置與使用指南

    PCA9617ADP - ARD評估板:功能、配置與使用指南 在電子設計領域,評估板是驗證和開發(fā)新器件的重要工具。今天,我們就來深入了解一下NXP Semiconductors推出
    的頭像 發(fā)表于 12-25 09:30 ?658次閱讀

    PCA9958HN - ARD評估板:24通道SPI總線LED驅(qū)動評估利器

    PCA9958HN - ARD評估板:24通道SPI總線LED驅(qū)動評估利器 在電子設計領域,LED驅(qū)動的評估和設計是一個重要的環(huán)節(jié)。NXP的PCA9958HN - ARD評估板為工程師們提供了一個
    的頭像 發(fā)表于 12-24 11:50 ?619次閱讀

    ADC的采樣濾波算法利用卡爾曼濾波算法

    , text{δ2為測量噪聲} end{cases} { Xk+1?=Xk?+δ1?,Zk+1?=Xk+1?+δ2?,?δ1?為系統(tǒng)噪聲δ2?為測量噪聲? 2 卡爾曼濾波算法 我們知道卡爾曼濾波算法
    發(fā)表于 12-01 07:44

    Vishay MRSE1PK快速開關整流器技術解析與應用指南

    Vishay MRSE1PK表面貼裝快速開關整流器是一款1A、800V微型表面貼裝快速整流器,非常適合用于自動貼裝應用。MRSE1PK具有低正向電壓降、漏電流和噪聲。Vishay MRSE1PK整流器采用超薄外形,具有氧化物平面
    的頭像 發(fā)表于 11-12 11:08 ?593次閱讀
    Vishay MRSE1<b class='flag-5'>PK</b>快速開關整流器技術解析與應用指南

    臺階儀1分鐘測半導體激光芯片Smile值,實測16組LDA芯片誤差&amp;lt;1μm

    半導體激光陣列LDA芯片作為大功率半導體激光器的核心部件,其封裝質(zhì)量直接決定了半導體激光器的可靠性。本文采用Flexfilm探針式臺階儀結合探針掃描法測量Smile效應,能夠?qū)?b class='flag-5'>LDA芯片批量化封裝
    的頭像 發(fā)表于 08-20 18:02 ?1678次閱讀
    臺階儀1分鐘測半導體激光芯片Smile值,實測16組<b class='flag-5'>LDA</b>芯片誤差&amp;lt;1μm

    PCA9958HN-ARD】GUI工具的使用

    一、說明 PCA9958HN-ARD評估板是可以通過NXP官方的GUI上位機來進行控制的,但是需要使用另外的官方指定的MCU開發(fā)板。 例如下圖就是通過LPC55S69-EVKMCU板來演示
    發(fā)表于 06-29 10:07

    RTC芯片有Linux PCA2131驅(qū)動程序嗎?

    RTC 芯片有 Linux PCA2131驅(qū)動程序嗎? 1) 如果沒有,我可以使用任何兼容的驅(qū)動程序來驅(qū)動這個 RTC 芯片嗎? 2) 如果是,我在哪里可以找到它?
    發(fā)表于 03-31 06:22