在2.3 節(jié)中,我們了解了線性代數(shù)的基礎(chǔ)知識,并了解了如何使用它來表達(dá)轉(zhuǎn)換數(shù)據(jù)的常見操作。線性代數(shù)是我們在深度學(xué)習(xí)和更廣泛的機(jī)器學(xué)習(xí)中所做的大部分工作的關(guān)鍵數(shù)學(xué)支柱之一。雖然第 2.3 節(jié) 包含足夠的機(jī)制來傳達(dá)現(xiàn)代深度學(xué)習(xí)模型的機(jī)制,但該主題還有更多內(nèi)容。在本節(jié)中,我們將更深入地介紹線性代數(shù)運(yùn)算的一些幾何解釋,并介紹一些基本概念,包括特征值和特征向量。
22.1.1. 向量幾何
首先,我們需要討論向量的兩種常見幾何解釋,即空間中的點(diǎn)或方向。從根本上說,向量是一個(gè)數(shù)字列表,例如下面的 Python 列表。
數(shù)學(xué)家最常將其寫成列向量或行 向量,也就是說
或者
這些通常有不同的解釋,其中數(shù)據(jù)示例是列向量,而用于形成加權(quán)和的權(quán)重是行向量。但是,保持靈活性可能是有益的。正如我們在2.3 節(jié)中所述 ,盡管單??個(gè)向量的默認(rèn)方向是列向量,但對于表示表格數(shù)據(jù)集的任何矩陣,將每個(gè)數(shù)據(jù)示例視為矩陣中的行向量更為常規(guī)。
給定一個(gè)向量,我們應(yīng)該給它的第一個(gè)解釋是空間中的一個(gè)點(diǎn)。在二維或三維中,我們可以通過使用向量的分量來定義這些點(diǎn)在空間中相對于稱為原點(diǎn)的固定參考的位置來可視化這些點(diǎn)。這可以在圖 22.1.1中看到。
圖 22.1.1將向量可視化為平面中的點(diǎn)的圖示。向量的第一個(gè)分量給出x-坐標(biāo),第二個(gè)分量給出y-協(xié)調(diào)。更高的維度是類似的,盡管更難形象化。
這種幾何觀點(diǎn)使我們能夠在更抽象的層面上考慮問題。不再面臨一些看似無法克服的問題,例如將圖片分類為貓或狗,我們可以開始將任務(wù)抽象地視為空間中的點(diǎn)集合,并將任務(wù)描繪為發(fā)現(xiàn)如何分離兩個(gè)不同的點(diǎn)簇。
平行地,人們經(jīng)常對矢量采取第二種觀點(diǎn):作為空間中的方向。我們不僅可以想到向量 v=[3,2]?作為地點(diǎn)3右邊的單位和2從原點(diǎn)向上的單位,我們也可以把它看作是要采取的方向本身3向右的步驟和2 加強(qiáng)。這樣,我們認(rèn)為圖 22.1.2中的所有向量都是相同的。
圖 22.1.2任何向量都可以看成是平面中的箭頭。在這種情況下,繪制的每個(gè)向量都是向量的表示 (3,2)?.
這種轉(zhuǎn)變的好處之一是我們可以從視覺上理解向量加法的行為。特別是,我們遵循一個(gè)向量給出的方向,然后遵循另一個(gè)向量給出的方向,如圖22.1.3所示。
圖 22.1.3我們可以通過首先跟隨一個(gè)向量,然后跟隨另一個(gè)向量來可視化向量加法。
矢量減法有類似的解釋。通過考慮身份u=v+(u?v), 我們看到向量u?v是帶我們離開點(diǎn)的方向v直截了當(dāng) u.
22.1.2。點(diǎn)積和角
正如我們在2.3 節(jié)中看到的,如果我們?nèi)蓚€(gè)列向量u和v,我們可以通過計(jì)算形成他們的點(diǎn)積:
因?yàn)?/font>(22.1.3)是對稱的,我們將鏡像經(jīng)典乘法的符號并寫成
強(qiáng)調(diào)交換向量的順序?qū)a(chǎn)生相同答案的事實(shí)。
點(diǎn)積(22.1.3)也有一個(gè)幾何解釋:它與兩個(gè)向量之間的角度密切相關(guān)。考慮圖 22.1.4中所示的角度。
圖 22.1.4平面內(nèi)任意兩個(gè)向量之間有一個(gè)明確的角度 θ. 我們將看到這個(gè)角度與點(diǎn)積密切相關(guān)。
首先,讓我們考慮兩個(gè)特定的向量:
載體v是長度r并平行于x
評論