模型開發(fā)
人工智能取得令人矚目的進步的主要因素之一是出現(xiàn)了更好的技術(shù),如GPU:可以實現(xiàn)更快速的數(shù)據(jù)處理。物聯(lián)網(wǎng)的機器學習帶來了一個有趣的難題:最好的模型需要接受大量數(shù)據(jù)的訓練,而大多數(shù)物聯(lián)網(wǎng)設備仍然受限于存儲空間和處理能力。因此,安全高效地將大量數(shù)據(jù)從物聯(lián)網(wǎng)設備傳送到服務器或云端,并提高數(shù)據(jù)輸出的能力是AI應用程序開發(fā)的關(guān)鍵。 在云計算時代,一種較好的解決方案是將數(shù)據(jù)導出到開發(fā)模型的云中,并在模型能夠投入使用后將模型導回到設備上。這非常具有吸引力,特別是因為預計到2021年所有生成的數(shù)據(jù)中有94%將在云中處理,這意味著可以利用其他數(shù)據(jù)源,無論是歷史數(shù)據(jù)還是源于其他物聯(lián)網(wǎng)設備的數(shù)據(jù)。然而,將復雜模型存儲回內(nèi)存受限的設備本身可能是一個挑戰(zhàn),因為具有大量參數(shù)的復雜模型(如深度學習模型)本身通常非常大。另一方面,包括從設備向云上的模型發(fā)送數(shù)據(jù)以進行推理步驟的解決方案也可能不是最優(yōu)方案,尤其是在需要延遲非常低的情況下進行。
另一個挑戰(zhàn)是物聯(lián)網(wǎng)設備可能無法連續(xù)連接到云,因此可能需要一些本地參考數(shù)據(jù)用于脫機處理,并具有獨立運行的功能。這是邊緣計算架構(gòu)變得有趣的地方,因為它使數(shù)據(jù)能夠在邊緣設備級別進行初始處理。在安全性方面,這種方法特別有吸引力;而且這種方法非常有利,因為這樣的邊緣設備能夠過濾數(shù)據(jù),減少噪聲并且當場改善數(shù)據(jù)質(zhì)量。
不出所料,人工智能工程師一直試圖獲得兩全其美的方案,并最終開發(fā)了霧計算,這是一個去中心化的計算基礎設施。在這種方法中,數(shù)據(jù),計算能力,存儲和應用程序以最合理的方式在設備和云之間分布,最終將它們更緊密地結(jié)合在一起來發(fā)揮它們各自的優(yōu)勢。
轉(zhuǎn)移學習
事實證明,物聯(lián)網(wǎng)設備能夠生成大數(shù)據(jù),但,使用外部歷史數(shù)據(jù)集開發(fā)物聯(lián)網(wǎng)智能應用程序并不罕見。這意味著可以依靠多個物聯(lián)網(wǎng)設備(通常是多個用戶的相同類型的設備)或完全不同的數(shù)據(jù)源生成的數(shù)據(jù)。應用程序越具體和獨特,現(xiàn)有數(shù)據(jù)集可供使用的可能性就越小,例如,當設備捕獲Imagenet中特定類型的圖像而與開放源圖像數(shù)據(jù)集沒有相似性時。但物聯(lián)網(wǎng)應用程序?qū)嶋H上是幾種現(xiàn)有的現(xiàn)成模型的巧妙結(jié)合,這使得轉(zhuǎn)換學習很好地適應了物聯(lián)網(wǎng)背景下智能應用的發(fā)展。
轉(zhuǎn)移學習范式包括在數(shù)據(jù)集上訓練模型(通常是黃金標準),并用它來推斷另一個數(shù)據(jù)集?;蛘撸梢詫⒃谏纱四P推陂g計算的參數(shù)用作在實際數(shù)據(jù)集上訓練模型時的起點,而不是將模型初始化為隨機值。在這種情況下,我們將原始模型稱為“預先訓練好的”模型,我們對應用程序特定的數(shù)據(jù)進行微調(diào)。這種方法可以將訓練階段加速幾個數(shù)量級。 使用相同的范例,可以訓練一個通用模型,最終用戶可以直接使用這些數(shù)據(jù)。
安全和隱私問題
由于互聯(lián)網(wǎng)連接設備技術(shù)通過提供物理和網(wǎng)絡世界之間的連接來擴展當前的互聯(lián)網(wǎng),因此它生成的數(shù)據(jù)是通用的,但也是導致嚴重隱私問題的原因。事實上,參與物聯(lián)網(wǎng)的大約50%的組織認為安全性是物聯(lián)網(wǎng)部署的最大障礙。考慮到大約三分之二的物聯(lián)網(wǎng)設備處于消費領(lǐng)域,以及一些共享數(shù)據(jù)的私密性,也就不難理解安全性問題為什么會是一個難題了。 這些顧慮以及與云頻繁數(shù)據(jù)傳輸相關(guān)的預期風險,解釋了用戶為何提出保護其數(shù)據(jù)的要求。
然而,當這些物聯(lián)網(wǎng)應用程序由“聯(lián)合”數(shù)據(jù)(即由多個用戶生成的數(shù)據(jù))驅(qū)動時,事情會變得更加隱伏:不僅可能直接泄露用戶數(shù)據(jù),當惡意代理對機器學習算法的輸出進行逆向工程以推斷私人信息時,就可能間接暴露用戶數(shù)據(jù),。因此,很有必要在發(fā)展物聯(lián)網(wǎng)的同時建立起完整的數(shù)據(jù)保護法。
物聯(lián)網(wǎng)機器學習是以人為中心的機器學習
由于物聯(lián)網(wǎng)設備使互聯(lián)網(wǎng)更貼近用戶并觸及人類生活的各個方面,因此它們通常允許收集相關(guān)數(shù)據(jù)。物聯(lián)網(wǎng)數(shù)據(jù)描述了用戶生活的方方面面,并使其比以往更容易理解用戶的需求,愿望,歷史和偏好。這使得物聯(lián)網(wǎng)數(shù)據(jù)成為完善的數(shù)據(jù),可以根據(jù)用戶的個性創(chuàng)建個性化的應用程序。
而且由于物聯(lián)網(wǎng)通過收集高度個性化的數(shù)據(jù)以及提供高度個性化的應用和服務來親密接觸我們的生活,因此物聯(lián)網(wǎng)機器學習有真正成為以人為本的機器學習的資格。
-
物聯(lián)網(wǎng)
+關(guān)注
關(guān)注
2939文章
47353瀏覽量
408358 -
機器學習
+關(guān)注
關(guān)注
66文章
8541瀏覽量
136245
原文標題:物聯(lián)網(wǎng)中機器學習面臨的挑戰(zhàn)和機遇(二)
文章出處:【微信號:SSDFans,微信公眾號:SSDFans】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
在物聯(lián)網(wǎng)設備面臨的多種安全威脅中,數(shù)據(jù)傳輸安全威脅和設備身份安全威脅有何本質(zhì)區(qū)別?
學習物聯(lián)網(wǎng)怎么入門?
學習物聯(lián)網(wǎng)可以做什么工作?
Java 在物聯(lián)網(wǎng)與嵌入式系統(tǒng)中的應用前景與挑戰(zhàn)
物聯(lián)網(wǎng)的應用范圍有哪些?
物聯(lián)網(wǎng)未來發(fā)展趨勢如何?
Nordic nRF54 系列芯片:開啟 AI 與物聯(lián)網(wǎng)新時代?
蜂窩物聯(lián)網(wǎng)怎么選
“數(shù)字鄉(xiāng)村”政策下的物聯(lián)網(wǎng)機遇

機器學習在物聯(lián)網(wǎng)中面臨怎樣的挑戰(zhàn)和機遇?
評論