chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

圖解支持向量機(jī)SVM

新機(jī)器視覺 ? 來源:新機(jī)器視覺 ? 作者:Rohit Pandey ? 2020-12-26 11:46 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者說:我以前一直沒有真正理解支持向量機(jī),直到我畫了一張圖。

1. 問題

支持向量機(jī)(SVM)旨在解決「分類」問題。數(shù)據(jù)通常包含一定數(shù)量的條目/行/點(diǎn)?,F(xiàn)在,我們想對每個數(shù)據(jù)點(diǎn)進(jìn)行分類。為簡單起見,我們假設(shè)兩個類別:「正類」和「負(fù)類」。這或許可以幫助解答以下問題:

基于圖像的像素數(shù)據(jù),判斷這張圖像中是否有貓(有貓則標(biāo)簽為正類);

基于郵件的主題、發(fā)送者、文本等,判斷該郵件是否為垃圾郵件;

判斷某個病人是否患有某種疾病。

其精髓在于,當(dāng)我們知道正確答案時,我們會想到一些將數(shù)據(jù)分為兩類的規(guī)則(對于支持向量機(jī)而言,「規(guī)則」是畫一個平面,一側(cè)的所有點(diǎn)均為「正」,另一側(cè)的所有點(diǎn)均為「負(fù)」)。當(dāng)我們遇到不知道類別的新數(shù)據(jù)點(diǎn)時,我們使用規(guī)則對其進(jìn)行分類。分類問題嚴(yán)重依賴約束優(yōu)化,同時也是約束優(yōu)化的一個直觀示例。大家可以參考以下博客或吳恩達(dá)的文章。

博客地址:https://towardsdatascience.com/lagrange-multipliers-with-pictures-and-code-ace8018dac5e

吳恩達(dá)文章地址:http://cs229.stanford.edu/notes/cs229-notes3.pdf

1.1 圖解

我以前一直沒有真正理解支持向量機(jī),直到我畫了一張圖。

我們可以看到特征空間中有一些點(diǎn)。為方便可視化,我們使用一個可在屏幕上觀看的 2D 特征空間。該空間中散落著一些數(shù)據(jù)點(diǎn),每個點(diǎn)具備二元標(biāo)簽((1/-1)。如下圖所示,我們將綠色點(diǎn)看作正類,紅色點(diǎn)看作負(fù)類,黃色點(diǎn)類別未知。如果讓你猜測黃色點(diǎn)的標(biāo)簽,你會怎么選?你可能會發(fā)現(xiàn)其中一些點(diǎn)并不是那么容易確認(rèn)類別。

圖 1:2-D 分類問題。綠色點(diǎn)是正類,紅色點(diǎn)是負(fù)類。你可以猜出黃色點(diǎn)的標(biāo)簽嗎?(繪圖工具:https://github.com/ryu577/pyray)

現(xiàn)在,如果我畫一條紫色線將兩個類別分割開,那么黃色點(diǎn)屬于哪個類別就清晰多了(紫色線上方是綠色點(diǎn),下方是紅色點(diǎn))。

圖 2:畫一條線,作為將正類標(biāo)簽和負(fù)類標(biāo)簽分割開來的「規(guī)則」?,F(xiàn)在,我們可以使用該規(guī)則標(biāo)注每個黃色點(diǎn)的類別。

然而,這條線并非唯一。有很多條紫色線可以將綠色點(diǎn)和紅色點(diǎn)完美分割(見下圖)。隨著下圖中紫色線的移動,某些黃色點(diǎn)就顯得很微妙了(它們處于紫色線的不同側(cè),因此它們的類別取決于你選擇使用哪條紫色線)。

圖 3:將紅色點(diǎn)和綠色點(diǎn)完美分割的線有很多條。那么我們應(yīng)該選擇哪一條呢?

問題在于,所有候選線中,哪一條是「最優(yōu)」的?有一點(diǎn)很清楚:當(dāng)上圖中的紫色線接近右下角的紅色點(diǎn)(critical point)時,其泛化效果不好,而當(dāng)它遠(yuǎn)離那個點(diǎn)時,其分割效果要好得多。因此,這個紅色點(diǎn)可以說明紫色線的分類效果,因此它是「關(guān)鍵點(diǎn)」。我們可以說,遠(yuǎn)離該紅色點(diǎn)的線同樣遠(yuǎn)離所有訓(xùn)練樣本,而靠近該紅色點(diǎn)的線最終的分類效果并不好。因此,離最近的訓(xùn)練樣本較遠(yuǎn)的線才是優(yōu)秀的分類器。

接下來,我們來看如何利用數(shù)學(xué)知識繪制分割線。

2. 繪制分割線

現(xiàn)在我們要(在 2D 空間中)畫一條分割線(在更高維度的空間中,則為分割面)。那么這條線是什么呢?它是具備某種共性的點(diǎn)的無限集合。這些點(diǎn)滿足一個特定公式。為了找到這個公式,我們先從最簡單的線 x 軸開始。x 軸上所有點(diǎn)的位置向量存在什么共性?v_x = [x,0],即它們對應(yīng)的 y 坐標(biāo)均為 0。

也就是說,x 軸上每個點(diǎn)的位置向量與指向 y 軸方向的向量是正交(垂直)的。

這個說法可能看起來比較晦澀難懂,但是我們必須這么說,因為這種現(xiàn)象其實對所有線都成立,而并非只適用于 x 軸。我們希望將此說法泛化至任意線?,F(xiàn)在每次挪動一小步,我們來看看穿過原點(diǎn)的線(如 x 軸)。如下圖所示,只需將 x 軸旋轉(zhuǎn)一定角度,就可以得到這些線。

圖 4:旋轉(zhuǎn) x 軸可以得到穿過原點(diǎn)的任意線。這些線上的每個點(diǎn)都與橙色向量相垂直。

隨著線的變化,與線相垂直的向量也在變化,但是所有線上每個點(diǎn)的位置向量都與某個向量垂直。我們把這個與線垂直的向量叫做 w。當(dāng)我們改變 w 時,就可以捕捉到所有此類線。

注意,對于任意給定線而言,存在多個 w 值。如果我們將向量 w 擴(kuò)展或縮小一定數(shù)值,該線上每個點(diǎn)的位置向量仍與向量 w 垂直。

圖 5:擴(kuò)大或縮小正交 w 向量。

為什么不把 w 向量限制在大小為 1 呢?下文中,我們將 w 向量的大小設(shè)為 1。

現(xiàn)在我們已經(jīng)將穿過原點(diǎn)的所有線都參數(shù)化了。那么那些沒有穿過原點(diǎn)的線呢?我們將穿過原點(diǎn)的線移動一定量,即在該線法向量 w 的方向上移動 b?,F(xiàn)在,w 與該線上每個點(diǎn)的位置向量的點(diǎn)積不為零,而是常量 b(參見下圖)。w 向量是從原點(diǎn)指向紫色線的單位向量,且與紫色線垂直。A 即紫色線上與原點(diǎn)最接近的點(diǎn)。假設(shè) OA 的距離是 -b。現(xiàn)在,考慮兩個隨機(jī)點(diǎn) B 和 C(分別是圖中綠色點(diǎn)和橙色點(diǎn))。將 OB 或 OC 與單位向量 w 相乘,分別得到三角形 OAB 和 OAC 的底。 在這兩種情況中,OA 為 -b。由于這兩個點(diǎn)只是紫色線上的任意點(diǎn),我們可以推斷出,紫色線上的所有點(diǎn)均滿足 w^T x+b=0(其中 x 表示紫色線上點(diǎn)的位置向量)。

圖 6:未穿過原點(diǎn)的線。

如果我們將不在該線上的點(diǎn)應(yīng)用于上述公式呢?得到的結(jié)果不是零,而是從該點(diǎn)到紫色線的垂直距離(對于紫色線上的點(diǎn)而言也是如此,所以它們所對應(yīng)的公式結(jié)果為零)。我們需要注意:這個結(jié)論僅適用于 |w|=1 的情況。下圖清晰說明了這一結(jié)果。B 為不屬于紫色線的任意點(diǎn),B』』 為從 B 到紫色線的垂點(diǎn),B』 為從 B 到 w 向量的垂點(diǎn)。從 B 到紫色線的垂直距離為 BB』』。但是由于 A-B』-B-B』』 是一個矩形,因此該垂直距離等于 AB』=OB』-OA?,F(xiàn)在,OB』 是 B 的位置向量與 w 的點(diǎn)積。因此,如果 x 是 B 的位置向量,則 |OB』| = w^T x。這意味著 |AB』|=w^T x-(-b)(OA=-b)。因此從點(diǎn) B 到紫色線的距離是:|AB』|=w^T x+b(該公式恰好是紫色線的公式)。

圖 7:將不在紫色線上的點(diǎn)應(yīng)用于紫色線公式會發(fā)生什么?我們得到該點(diǎn)與紫色線之間的垂直距離。

注意,在 w 指向方向一側(cè)的所有點(diǎn)(如圖 7 中的點(diǎn) B)到紫色線的垂直距離為正值,而另一側(cè)點(diǎn)的垂直距離為負(fù)值。

在 w 指向方向一側(cè)的所有點(diǎn)均得到正類標(biāo)簽 (t_i=1),而另一側(cè)的所有點(diǎn)均得到負(fù)類標(biāo)簽 (t_i=-1)。因此,如果我們將這些標(biāo)簽與垂直距離相乘,則所有點(diǎn)調(diào)整后的垂直距離均為正,前提是這些點(diǎn)均被紫色線正確分類(即具備正類標(biāo)簽的點(diǎn)在線一側(cè),具備負(fù)類標(biāo)簽的點(diǎn)在另一側(cè))。

3. 最佳分割線

現(xiàn)在到了 SVM 的重點(diǎn)了。我們將任意點(diǎn)到分割線的調(diào)整后垂直距離叫做「間距」(margin)。那么,對于任意給定分割線,所有點(diǎn)均具備間距(如果點(diǎn)被分割線正確分類,則間距為正,反之則間距為負(fù))。我們想獲取將正類和負(fù)類完美分割的線。也就是說,間距越大越好,即使是對于鄰近界限(分割平面)的點(diǎn)。

那么,最大化所有間距(甚至是最接近分割線的點(diǎn)的間距)的分割平面應(yīng)該能夠很好地分割這些點(diǎn)?,F(xiàn)在,給出 (w,b),第 i 個點(diǎn)的間距為:

04fc60f4-4699-11eb-8b86-12bb97331649.png

間距公式。

其中 x_i 表示特征空間中的位置向量,t_i 表示標(biāo)簽:1 為正類,-1 為負(fù)類。

所有點(diǎn)中的最小間距為:

0530d06e-4699-11eb-8b86-12bb97331649.png

公式 1:所有點(diǎn)中的最小間距。

我們想讓 (w,b) 最大化上述最小間距。也就是:

05c2e8fa-4699-11eb-8b86-12bb97331649.png

即我們想讓 (w,b) 滿足 |w|=1,且最大化間距:

05f25cb6-4699-11eb-8b86-12bb97331649.png

公式 2:SVM 目標(biāo)函數(shù)。

注意:如果這條線沒有分離數(shù)據(jù),那么對于 (w,b),某些點(diǎn)的間距

04fc60f4-4699-11eb-8b86-12bb97331649.png

間距公式。

為負(fù)。且這些點(diǎn)中的其中一個會在第一次最小化中「脫穎而出」,這意味著 (w,b) 無法在第二次 arg max 時勝出。因此,該公式保證了勝出的 (w,b) 能夠分割數(shù)據(jù)。

公式 2 是一個優(yōu)化問題,涉及最小化和最大化(mini-max)。解決一級優(yōu)化總比二級優(yōu)化要簡單。因此,我們嘗試將公式 2 轉(zhuǎn)化為約束優(yōu)化問題。

我們用 γ 表示所有點(diǎn)的最小間距。

066b0972-4699-11eb-8b86-12bb97331649.png

公式 3:約束。

最終得到的優(yōu)化問題為:

06a9c536-4699-11eb-8b86-12bb97331649.png

公式 4:SVM 優(yōu)化問題。

上述優(yōu)化問題具備二次/線性約束和線性目標(biāo)函數(shù)。我們可以使用二次規(guī)劃求解器(quadratic programming solver)和最優(yōu)分割線/平面 (w,b) 解決該問題。

現(xiàn)在,我們來試著進(jìn)一步簡化該問題。我們發(fā)現(xiàn)可以去除 γ。其代價是,我們必須放棄 w^T w = 1 這一要求。但這是值得的。我們使用 γ 將約束分割為兩部分,得到:

06d4d79e-4699-11eb-8b86-12bb97331649.png

公式 5:使用 γ 分割分割平面公式。

現(xiàn)在,使

070546d6-4699-11eb-8b86-12bb97331649.png

引入新的 w 變量。

為兩側(cè)取絕對值:

07245198-4699-11eb-8b86-12bb97331649.png

取絕對值。

我們之前要求 |w|=1。這意味著:

0750e67c-4699-11eb-8b86-12bb97331649.png

因此,公式 3 變成了:

078c7246-4699-11eb-8b86-12bb97331649.png

公式 5 和公式 6 使公式 4 中的優(yōu)化問題變成了:

07d1f38e-4699-11eb-8b86-12bb97331649.png

現(xiàn)在,優(yōu)化問題有了一個丑陋的目標(biāo)函數(shù)。但是最大化 1/|w| 等同于最小化 |w|,等同于最小化 |w|2。添加 1/2 使得計算更加簡單。

因此,上述優(yōu)化問題變?yōu)椋?/p>

080ebda0-4699-11eb-8b86-12bb97331649.png

公式 7

現(xiàn)在,該優(yōu)化問題具備二次目標(biāo)函數(shù)和線性約束(線性約束二次規(guī)劃,LCQP)。使用二次規(guī)劃求解器即可解決該問題。

現(xiàn)在,我們知道如何通過解決優(yōu)化問題找出最優(yōu)分割線了。透過表面查看解決這類優(yōu)化問題的真正機(jī)制,會幫助我們對該問題了解更多,具備更強(qiáng)大的洞察和見解。

責(zé)任編輯:xj

原文標(biāo)題:透過現(xiàn)象看本質(zhì),圖解支持向量機(jī) SVM

文章出處:【微信公眾號:新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 向量機(jī)
    +關(guān)注

    關(guān)注

    0

    文章

    166

    瀏覽量

    21614
  • SVM
    SVM
    +關(guān)注

    關(guān)注

    0

    文章

    154

    瀏覽量

    33642

原文標(biāo)題:透過現(xiàn)象看本質(zhì),圖解支持向量機(jī) SVM

文章出處:【微信號:vision263com,微信公眾號:新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    用哪吒D1開發(fā)板體驗riscv向量底層編程

    1.前言 2.機(jī)器模式處理器狀態(tài)寄存器(MSTATUS) 3.編譯選項支持V擴(kuò)展 4.RISCV向量計算的原理 5.通過實例分析RISCV V擴(kuò)展的運(yùn)作機(jī)制 6.RVV使用體驗 1.前言
    發(fā)表于 10-29 06:21

    Vector向量指令集簡介(一)

    RV32V將數(shù)據(jù)寄存器和長度與向量寄存器關(guān)聯(lián)而不是指令操作碼。程序在執(zhí)行V指令之前會用數(shù)據(jù)類型和數(shù)據(jù)寬度來標(biāo)記向量寄存器,因為每個V指令通常有8個整數(shù)版本和三個浮點(diǎn)版本。 這個編碼一共5位,低
    發(fā)表于 10-23 08:28

    Vector向量指令集簡介(三)

    首先是vl寄存器,這個寄存器保存一個無符號數(shù),位寬為XLEN,表示向量指令的結(jié)果將要更新的元素的數(shù)量。這個寄存器通過vset{i}vl{i}指令來更新 vlenb寄存器是一個只讀的寄存器,它記錄
    發(fā)表于 10-23 06:23

    Vector向量指令集簡介(四)

    前面講的都是狀態(tài)寄存器的概念介紹,今天開始講解Vector向量指令的指令格式。 對于load/store兩類指令,它們都是對內(nèi)存直接操作的指令。 比較值得說的是,rs1的值索引的是內(nèi)存的基地
    發(fā)表于 10-22 06:06

    使用MATLAB的支持向量機(jī)解決方案

    支持向量機(jī) (SVM) 是一種有監(jiān)督機(jī)器學(xué)習(xí)算法,它能找到分離兩個類的數(shù)據(jù)點(diǎn)的最佳超平面。
    的頭像 發(fā)表于 10-21 15:00 ?558次閱讀
    使用MATLAB的<b class='flag-5'>支持</b><b class='flag-5'>向量</b><b class='flag-5'>機(jī)</b>解決方案

    圖解環(huán)路設(shè)計及控制技術(shù)探討

    由于之前缺乏控制理論方面的知識在剛接觸反饋環(huán)路的時候?qū)ζ渲械暮芏嗝~不是很明白,這次準(zhǔn)備采用圖解的方法逐一的搞清楚這些名詞并且試圖找出一種便捷的設(shè)置零、極點(diǎn)的方法。最后準(zhǔn)備再探討一下關(guān)于控制技術(shù)
    發(fā)表于 08-22 17:39

    在中斷向量表中,數(shù)字較小的中斷向量能否以 larg 中斷中斷向量?

    在中斷向量表中,數(shù)字較小的中斷向量能否以 larg 中斷中斷向量
    發(fā)表于 08-21 08:17

    milvus向量數(shù)據(jù)庫的主要特性和應(yīng)用場景

    Milvus 是一個開源的向量數(shù)據(jù)庫,專門為處理和分析大規(guī)模向量數(shù)據(jù)而設(shè)計。它適用于需要高效存儲、檢索和管理向量數(shù)據(jù)的應(yīng)用場景,如機(jī)器學(xué)習(xí)、人工智能、計算機(jī)視覺和自然語言處理等。
    的頭像 發(fā)表于 07-04 11:36 ?968次閱讀
    milvus<b class='flag-5'>向量</b>數(shù)據(jù)庫的主要特性和應(yīng)用場景

    圖解單片機(jī)功能與應(yīng)用(完整版)

    從基礎(chǔ)知識的介紹出發(fā),圖文并茂,直觀、系統(tǒng)地介紹了單片機(jī)的內(nèi)部結(jié)構(gòu)、工作原理和應(yīng)用技巧。全書分為10章,內(nèi)容包括51單片機(jī)編程資源圖解、51單片機(jī)指令系統(tǒng)
    發(fā)表于 06-16 16:52

    RISC-V架構(gòu)下的編譯器自動向量

    高性能算力生態(tài)的建設(shè),正投入編譯器自動向量化優(yōu)化等多項關(guān)鍵技術(shù),全面助力RISC-V的高性能發(fā)展。RISC-V向量設(shè)計SpacemiT在現(xiàn)代CPU中,向量支持是算力的
    的頭像 發(fā)表于 06-06 16:59 ?1123次閱讀
    RISC-V架構(gòu)下的編譯器自動<b class='flag-5'>向量</b>化

    漫畫圖解 電感器 抗干擾元器件指南(全彩PDF版)

    漫畫圖解電感基礎(chǔ)知識(高清PDF) 內(nèi)容:很形象的漫畫和語言圖解關(guān)于電感器的入門基礎(chǔ)知識,讓電子初學(xué)者也能輕松的看懂電子電路。 純分享貼,有需要可以直接下載附件獲取完整資料! (如果內(nèi)容有幫助可以關(guān)注、點(diǎn)贊、評論支持一下
    發(fā)表于 05-13 15:49

    Redis 8 向量搜索實測:輕松擴(kuò)展至 10 億向量

    艾體寶Redis 8 向量搜索實測輕松支持 10 億向量,仍保持低延遲與高吞吐。中位延遲僅200毫秒,90%精確度;處理50并發(fā)搜索請求中位延遲僅1.3秒,95%精確度。
    的頭像 發(fā)表于 05-13 14:00 ?667次閱讀
    Redis 8 <b class='flag-5'>向量</b>搜索實測:輕松擴(kuò)展至 10 億<b class='flag-5'>向量</b>

    PCB封裝圖解

    PCB封裝圖解——詳細(xì)介紹了各種封裝的具體參數(shù),并介紹了如何進(jìn)行封裝制作 純分享貼,有需要可以直接下載附件獲取文檔! (如果內(nèi)容有幫助可以關(guān)注、點(diǎn)贊、評論支持一下哦~)
    發(fā)表于 04-22 13:44

    無刷電機(jī)的繞制和接線方法及實物圖解

    下方附件可打開*附件:無刷電機(jī)的繞制和接線方法及實物圖解.doc
    發(fā)表于 03-17 20:00

    曙光云全面支持DeepSeek大模型

    近日,曙光云正式宣布,全系列產(chǎn)品將全面支持DeepSeek。產(chǎn)品涵蓋用于大型云計算中心建設(shè)的曙光云Stack云平臺,及適用于小規(guī)模私有化建設(shè)的曙光云HCI超融合和SVM虛擬化產(chǎn)品。旨在滿足政務(wù)云運(yùn)營及企業(yè)自建人工智能數(shù)據(jù)中心的多樣化需求,進(jìn)一步推動AI技術(shù)在各行業(yè)的廣泛應(yīng)
    的頭像 發(fā)表于 02-14 09:24 ?922次閱讀