chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

到底是什么讓機器學(xué)習(xí)達(dá)不到我們的期待呢?

nlfO_thejiangme ? 2018-03-27 13:56 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

機器學(xué)習(xí)雖然能夠在很多地方顯示出強大的力量,同時也被集成到了很多的商業(yè)流程中去,但它依舊有一些不完美的地方,今天我們就通過一些典型的例子來深刻感受一下機器學(xué)習(xí)的局限性。

人臉識別

目前最先進(jìn)的人臉識別系統(tǒng)可以達(dá)到99%的準(zhǔn)確率。作為使用最為廣泛的機器學(xué)習(xí)算法,人臉識別得到了飛速的發(fā)展,但在這背后需要我們對幾件事情保持清醒。首先,99%的正確率是來自與驗證數(shù)據(jù)集的測試結(jié)果,而驗證數(shù)據(jù)集則來自于與訓(xùn)練數(shù)據(jù)集相同的數(shù)據(jù)集,并從中隨機抽取。這就意味著數(shù)據(jù)的均值和方差與訓(xùn)練數(shù)據(jù)十分相似。但當(dāng)我們將系統(tǒng)置于真實情況下時,實際照片的特性與訓(xùn)練數(shù)據(jù)不可能相同,那么實際的精度很有可能低于99%。

模型有時候會將其他的東西識別成人臉(假陽性)或者忘卻漏掉了人臉(假陰性)。不同的模型在不同的階段有著不同的表現(xiàn),在使用時你需要確定你需要什么樣層次的模型,給出多高的精度是可以接受的。在選擇權(quán)衡算法時,一個模型在檢測幾千張臉時錯檢幾十張,而另一個模型可以將準(zhǔn)確率提高一半但需要10x的處理時間和運算,那么前者將會是不錯的選擇。剩下的可以交給人類來做,我們對于少量假陽性和假陰性的樣本有著非??斓臏?zhǔn)確識別能力。

下面是幾個關(guān)于模型訓(xùn)練的數(shù)據(jù)清理經(jīng)驗。最好的當(dāng)然是保證每一張臉都可以很容易地看到,沒有模糊遮擋,也沒有很奇怪的角度。同時圖像要保持適度的分辨率,分辨率太高的圖像容易引入造成算法失效的噪音。

光學(xué)字符識別(OCR)

目前最先進(jìn)的光學(xué)字符識別系統(tǒng)對于文件的識別與排版已經(jīng)有十分優(yōu)異?;谶吘墮z測、計算機視覺與字符識別的技術(shù)使得OCR不斷改進(jìn),對于掃描文檔幾乎沒有障礙了。

但目前OCR還不能夠勝任的是非掃描文件的識別,這也是驗證碼還能作為網(wǎng)站人類識別的功能存在。人類對于字母識別有著無與倫比的能力,無論是模糊、扭曲、顏色不同都不在話下,而計算機望塵莫及。

OCR很有用但對于一些場景下使用不當(dāng)就會文不對題,下面這張球賽的截頻就是一個典型的例子。

上圖如果用OCR識別很有可能生成這樣的一大串:

[0] PREMIER LEAGUE [1] TOT 2 [2] M [3] U [4] 0 [5] 36:2 [6] 4 [7] SPORTS [8] NEW 0 BUR 0 [9] HALFTIME [10] LIVE [11] NBCSN

如果沒有上下文語境我們很難明白識別出的意思,哪里是隊名哪里是logo?這會造成很大的混亂。

我們不應(yīng)該像使用通用OCR一樣來直接簡單粗暴的套用,而是需要針對情況進(jìn)行分析。對于上面的例子如果我們想要追蹤球員,那么目標(biāo)追蹤的方法會很好,但如果想要追蹤比賽分?jǐn)?shù)和時間,那么將OCR限定在固定區(qū)域中會是不錯的選擇。

視 頻

視頻是一種很神奇的存在,雖然很多機器學(xué)習(xí)模型能在視頻上實現(xiàn)和照片一樣的效果,但總會有意想不到的情況。數(shù)字世界的解碼和封裝總是與視頻的壓縮率和長寬比耦合在一起。

同時考慮到處理時間和算力的限制,對視頻進(jìn)行處理時我們往往選擇低分辨的格式。當(dāng)你選擇低分辨率或者較高的壓縮時,視頻并不會是一組連續(xù)的靜態(tài)圖片,所以計算機視覺的識別方法將會與靜態(tài)圖片中的識別方法有很大的差別。

為了說明這一情況我們可以隨便點開一個視頻并暫停,如下圖所示。人們的臉變得模糊、角度和整體形象都顯得和靜態(tài)下十分不同。

下面應(yīng)該是計算機看到的人臉區(qū)域:

你能從中認(rèn)出圖中的主角是誰嗎?如果對你來說很困難那么對于計算機來說也不容易!

對于人類來說,在視頻中識別人臉很容易,但要把獨立的幀抽取出來你會發(fā)現(xiàn)圖像質(zhì)量出乎意料的差。

但我們也不能否定機器學(xué)習(xí),因為機器學(xué)習(xí)在大多數(shù)情況下對于視頻的自動化分類和標(biāo)注時十分重要的手段。我們需要明白的是我們期望得到的結(jié)果以及如何去修正模型實際的表現(xiàn)。如果一個龐大的全球名人識別模型對一段視屏進(jìn)行檢測可能會出現(xiàn)很多假陽性的結(jié)果,但是如果使用一個僅僅包含幾個著名人士的模型來檢測則會得到好得多的結(jié)果。如果你的模型表現(xiàn)不好,你還可以從數(shù)據(jù)的角度來改進(jìn),譬如說某個節(jié)目中人臉出現(xiàn)的位置就可以作為先驗知識來幫助機器提高正確率。我們需要嘗試不同的模型和工作流總能取得成功。

如何成功的應(yīng)用機器學(xué)習(xí)?

機器學(xué)習(xí)十分強大,有人將它應(yīng)用于檢測學(xué)術(shù)造假的論文,也有人將它應(yīng)用于人臉身份認(rèn)證、不良內(nèi)容的裸露檢測等。同樣也用于為用戶推薦商品和服務(wù)的推薦引擎上,在這樣的場景下假陽性和假陰性的推薦結(jié)果不會造成太大影響,事實上一些異常推薦還為用戶探索新事物提供了條件。

還有改善搜索引擎的個性化能力,檢測農(nóng)作物動物的疾病以及預(yù)測產(chǎn)量等等方面。機器學(xué)習(xí)將會有無數(shù)的應(yīng)用,我們對它充滿期待,但同時也會把握住期待的方向讓機器學(xué)習(xí)正常運轉(zhuǎn)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人臉識別
    +關(guān)注

    關(guān)注

    77

    文章

    4104

    瀏覽量

    87248
  • 機器學(xué)習(xí)
    +關(guān)注

    關(guān)注

    66

    文章

    8532

    瀏覽量

    136020

原文標(biāo)題:靈魂拷問:是什么讓機器學(xué)習(xí)達(dá)不到我們的期待呢?(開頭有個大事兒)

文章出處:【微信號:thejiangmen,微信公眾號:將門創(chuàng)投】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    IEC 到底是什么?為什么它能影響全球?

    IEC 到底是什么?為什么它能影響全球?
    的頭像 發(fā)表于 09-04 17:07 ?1694次閱讀

    晶振的 “負(fù)載電容” 到底是什么

    負(fù)載電容,到底是什么? 負(fù)載電容,簡單來說,是指晶振的兩條引線連接IC塊內(nèi)部及外部所有有效電容之和,我們可以將其看作晶振片在電路中串接的電容。從更專業(yè)的角度講,它是為了使晶振能夠在其標(biāo)稱頻率下穩(wěn)定
    的頭像 發(fā)表于 07-25 16:26 ?481次閱讀

    智能盒子到底是什么東西?昇騰310深度測評:為何能成為行業(yè)新寵?

    人摸不著頭腦的“智能盒子”。各位搞技術(shù)、搞工程的朋友,咱們在工作中是不是經(jīng)常聽到“智能盒子”這個說法?每次聽到這個詞,我猜很多人心里都在犯嘀咕:這東西到底是個啥玩意兒?難道就是個裝了點智能軟件的普通盒子?它到底有啥用?能給咱們
    的頭像 發(fā)表于 04-27 10:46 ?1347次閱讀
    智能盒子<b class='flag-5'>到底是</b>什么東西?昇騰310深度測評:為何能成為行業(yè)新寵?

    ADS1298 tdr的值到底是多大,跟采樣率等有沒有什么關(guān)系?

    我想請問一下, 1、tdr的值到底是多大,跟采樣率等有沒有什么關(guān)系。數(shù)據(jù)手冊上只找到建立時間,好像沒有這個時間的值,28頁那個最小SCLK時鐘為110khz是怎么計算的。 2、 tdr到底是
    發(fā)表于 02-13 06:11

    ADS1298的操作溫度范圍到底是多少?

    ADS1298是 0°Cto +70°C;工業(yè)級ADS1298I 是 –40°Cto +85°C。 現(xiàn)在不知道ADS1298的操作溫度范圍到底是多少?
    發(fā)表于 02-10 07:19

    ADS1298ECG-FE原理圖上看見很多NI的符號, 到底是什么意思?

    我們在ADS1298ECG-FE原理圖上看見很多NI的符號, 到底是什么意思? 具體的值是多少? 如下面兩個圖所示: R1, R2電阻的值是多少? 這個比較重要。 R59
    發(fā)表于 02-05 08:16

    ADS1278的參考電壓的要求到底是怎樣的?

    <27MHz為例,Vrefp輸入范圍為0.5到3.1V 而后文又提到,參考輸入電壓的范圍為AGND-0.4v to AVDD+0.4v 問題1. 這個參考電壓的要求到底是怎樣的? 問題2.
    發(fā)表于 01-23 08:02

    為什么DAC7811輸出達(dá)不到Vref?

    為什么DAC7811輸出達(dá)不到Vref,并且根據(jù)手冊上的這個圖輸出怎么不是線性的,不滿足這個等式V OUT=-V REF x CODE/4096
    發(fā)表于 01-17 07:38

    如何選擇云原生機器學(xué)習(xí)平臺

    當(dāng)今,云原生機器學(xué)習(xí)平臺因其彈性擴展、高效部署、低成本運營等優(yōu)勢,逐漸成為企業(yè)構(gòu)建和部署機器學(xué)習(xí)應(yīng)用的首選。然而,市場上的云原生機器
    的頭像 發(fā)表于 12-25 11:54 ?637次閱讀

    ADS7950的SPI通訊速率達(dá)不到最高20MHz怎么處理?

    我們在調(diào)試ADS7950的時候發(fā)現(xiàn),和單片機的SPI通訊速率達(dá)不到最高20MHz,只有8MHz。請問我是否需要特別配置什么嗎。 我打電話問過你們TI工程客服,他們回復(fù)【SPI的通訊速率取決
    發(fā)表于 11-29 07:47

    什么是機器學(xué)習(xí)?通過機器學(xué)習(xí)方法能解決哪些問題?

    來源:Master編程樹“機器學(xué)習(xí)”最初的研究動機是計算機系統(tǒng)具有人的學(xué)習(xí)能力以便實現(xiàn)人工智能。因為沒有學(xué)習(xí)能力的系統(tǒng)很難被認(rèn)為是具有智能
    的頭像 發(fā)表于 11-16 01:07 ?1389次閱讀
    什么是<b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>?通過<b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>方法能解決哪些問題?

    PCM4220的輸入范圍達(dá)不到手冊中說的5.6V,為什么?

    經(jīng)過電路板的實際測試發(fā)現(xiàn)PCM4220的輸入范圍達(dá)不到手冊中說的5.6V,測試結(jié)果是5.4V;PCM1792A的輸出電流也達(dá)不到手冊中說的7.8mA,實際測試在7.5mA,請問這是什么原因,電路就是按照手冊中給出
    發(fā)表于 11-07 06:40

    opa1612使用tina-ti進(jìn)行功能仿真,為什么在20-100Hz間的喇叭的輸出電壓達(dá)不到預(yù)期的增益?

    要設(shè)計一個簡單的音頻放大(在20-3400Hz內(nèi)),選擇opa1612,使用tina-ti進(jìn)行功能仿真,為什么在20-100Hz間的喇叭的輸出電壓達(dá)不到預(yù)期的增益?是因為電路問題還是仿真有問題?
    發(fā)表于 11-06 08:34

    TPA3123 SE工作方式,實際輸出功率達(dá)不到標(biāo)稱的70%,為什么?

    1、SE工作方式,實際輸出功率達(dá)不到標(biāo)稱的70%:現(xiàn)象用示波器在負(fù)載兩端觀察,測試正弦波信號的上半周會先于下半周失真,從而影響輸出功率。 2、串?dāng)_只有20~40dB,達(dá)不到標(biāo)稱參數(shù):人不解的是,串?dāng)_信號波形是正弦波的半周,
    發(fā)表于 11-06 08:19

    TLV320AIC3254內(nèi)部中的ADC處理模塊和minidsp到底是什么關(guān)系?

    我想請問一下幾個問題: 1.3254內(nèi)部中的ADC處理模塊和minidsp到底是什么關(guān)系,是并列的還是串行關(guān)系?還是ADC處理模塊就是minidsp特殊情況下的部分? 2.minidsp的抽取因子該怎么理解,到底怎么使用?
    發(fā)表于 10-31 06:02