chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

神經網絡技術解析:手寫數字識別項目解讀

電子設計 ? 來源:機器之心 ? 作者:澤南 張倩 ? 2021-01-13 15:50 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

手寫數字識別是很多人入門神經網絡時用來練手的一個項目,但就是這么簡單的一個項目,最近在 reddit 上又火了一把,因為在 MIT 計算機科學和人工智能實驗室,有人挖到了一個「祖師爺」級別的視頻……

這段視頻錄制于 1993 年,主人公是圖靈獎得主 Yann LeCun(楊立昆)。彼時 LeCun 才 32 歲,剛剛進入貝爾實驗室工作,而視頻里機器學習識別的第一段數字 201-949-4038,是 LeCun 在貝爾實驗室里的電話號碼。 從這段視頻中我們可以看到,LeCun 在 90 年代初創(chuàng)造的文本識別系統已經達到了驚人的速度和準確率,這在當時的條件下是非常難能可貴的。

這段視頻由貝爾實驗室自適應系統研究部門主任 Larry Jackel 拍攝(Larry 當時是 LeCun 的 boss,現任英偉達自動駕駛顧問)。視頻中出鏡的還有實驗室負責人 Rich Howard(Larry 的 boss)和研究工程師 Donnie Henderson。Yann LeCun 本人表示:「Donnie Henderson 將整個演示系統整合在了一起…… 整套系統在算力為 20MFLOPS 的 DSP 版上運行?!?/p>

幾位工程師在視頻中洋溢的笑容也頗具感染力。

LeCun 表示,1993 年的文字識別系統已經用上了卷積神經網絡(CNN),自己在這套系統中編寫了一種網絡數據結構的編譯器,并生成了可編譯的 C 語言代碼,在源代碼中以權重和網表(netlist)代表文字。 這段視頻的驚艷之處還在于,它比經典手寫數字數據集 MNIST 的問世還要早 6 年。

pIYBAF_-pMeAMHCAAABq5qkjYcU826.png

其實,早在 1989 年,LeCun 就已經發(fā)表了「將反向傳播用于手寫郵政編碼識別」的相關研究,而且已經在美國的郵政系統中成功應用。隨后,這一系統的應用范圍擴展至銀行支票。90 年代末期,該系統已經處理了美國 10%-20%的支票識別。

o4YBAF_-pNWAK3ObAALBa2Q5DDU736.png

1999 年,LeCun 等人聯合發(fā)表了「MNIST」手寫數字數據集。這一數據集包含數萬個樣本,被稱為「計算機視覺領域的 hello world 數據集」、「機器學習界的果蠅」,如今已經作為基準被使用了二十余年。

pIYBAF_-pOWAejsuAAIT49kFyNQ943.png

在看了這段視頻之后,有研究者感嘆,「不要再抱怨 GPU 算力不夠了」。

o4YBAF_-pPGAYaTEAAByJSj2qWU470.png

深度學習先驅 Yann LeCun 說起 Yann LeCun,熟悉人工智能領域的人肯定不會陌生,Yann LeCun 現在是紐約大學教授、美國工程院院士、Facebook 副總裁和首席 AI 科學家。 在深度學習還未流行的 20 世紀八九十年代,LeCun 與另兩位先驅者 Yoshua Bengio、Geoffrey Hinton 一道探索了深度學習領域的概念基礎,并通過實驗向人們展示了新方法的前景。此外,他們還貢獻了一系列工程進展,展示了深度神經網絡的實用優(yōu)勢。 雖然在二十世紀八十年代,研究者就開始試用人工神經網絡幫助計算機識別模式、模擬人類智能,但直到二十一世紀的前幾年,這種方式仍未獲得廣泛認同,LeCun 等研究者試圖重燃 AI 社區(qū)對神經網絡興趣的努力曾經一直被人們質疑,但如今他們的想法帶來了重大的技術進步,他們的方法也已成為該領域的主導范式。 自 2012 年以來,深度學習方法促進計算機視覺、語音識別、自然語言處理和機器人技術等應用領域取得極大突破。 在 2019 年,美國計算機協會 ACM 公布了上一年度的圖靈獎,Yoshua Bengio、Geoffrey Hinton 和 Yann LeCun 三位深度學習巨頭同時獲獎。

從左至右:Yoshua Bengio、Geoffrey Hinton、Yann LeCun。 ACM 表示,Yann LeCun 主要作出了三大貢獻:

  • 提出卷積神經網絡
  • 改進反向傳播算法
  • 拓寬神經網絡的視角

20 世紀 80 年代后期,LeCun 就職于多倫多大學和貝爾實驗室,也是在這一時期,他利用手寫數字圖像訓練了第一個卷積神經網絡系統。如今,卷積神經網絡已成為計算機視覺、語音識別、語音合成、圖像合成和自然語言處理領域的行業(yè)標準。卷積神經網絡有著廣泛的應用,如自動駕駛、醫(yī)學圖像分析、語音助手和信息過濾等。 這可不是搞定 MNIST 那么簡單 與我們通常為 MINIST 數據集構建文字識別系統不同,Yann LeCun 在 1993 年展示的技術可是用攝像頭直接拍攝的,還需要搞定文字縮放、位置等問題,后來也確實在郵政系統里獲得了應用。 如此看來在當年就能實現這樣的效果確實不容易,更何況在 20 世紀 90 年代,研究者們是沒有 TensorFlow 可用的,全靠 C 語言手寫,這個問題求解的非機器學習部分與其說是困難,不如說是繁瑣。 在社交網絡中,人們對 LeCun 展示的算法除了感興趣,還有贊譽和膜拜,有人說道:「這并不是說他們在 1993 年就解決了 MNIST 上的問題,比那還要更進一步?!? 在深度學習被 GPU 帶動開展大規(guī)模應用以前,人工智能算法其實已經實現了相當的聰明程度。在 1993 年的文字識別之后,昨天,人們又挖出了 LeCun 參與的另一項研究:人臉檢測。

在 2003 年,一個視頻展示了 Rita Osadchy、Matt Miller 以及 Yann LeCun 等人在 NEC 實驗室的研究,使用卷積神經網絡進行人臉檢測研究。 雖然只是人臉檢測而不是人臉識別,但這種技術的意義不言而喻,如今自動駕駛汽車上的障礙物檢測方法使用的就是和它相同的技術。在推特上,LeCun 也點贊了這段視頻。

看來,如今我們在機器學習領域廣泛使用的方法,早在幾十年前就已完成了整體架構。 不過與此同時,也有網友發(fā)出了直擊靈魂的提問:「既然 LeCun 在 1993 年就可以讓 AI 這樣識別文字了,為啥直到今天大多數網站仍然認為文字驗證碼是識別機器人的好辦法?」
編輯:hfy

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • 計算機
    +關注

    關注

    19

    文章

    7663

    瀏覽量

    90834
  • 人工智能
    +關注

    關注

    1807

    文章

    49029

    瀏覽量

    249646
  • 機器學習
    +關注

    關注

    66

    文章

    8503

    瀏覽量

    134646
  • 深度學習
    +關注

    關注

    73

    文章

    5561

    瀏覽量

    122805
  • 卷積網絡
    +關注

    關注

    0

    文章

    43

    瀏覽量

    2561
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    基于LockAI視覺識別模塊:手寫數字識別

    : 卷積神經網絡(CNN):最流行的方法之一,能夠自動從圖像中學習特征。適用于復雜背景和不同書寫風格的手寫數字識別。 支持向量機(SVM):一種傳統的機器學習方法,通過提取圖像的特征(
    發(fā)表于 06-30 16:45

    基于LockAI視覺識別模塊:手寫數字識別

    手寫數字識別是一種經典的模式識別和圖像處理問題,旨在通過計算機自動識別用戶手寫
    的頭像 發(fā)表于 06-30 15:44 ?446次閱讀
    基于LockAI視覺<b class='flag-5'>識別</b>模塊:<b class='flag-5'>手寫</b><b class='flag-5'>數字</b><b class='flag-5'>識別</b>

    基于FPGA搭建神經網絡的步驟解析

    本文的目的是在一個神經網絡已經通過python或者MATLAB訓練好的神經網絡模型,將訓練好的模型的權重和偏置文件以TXT文件格式導出,然后通過python程序將txt文件轉化為coe文件,(coe
    的頭像 發(fā)表于 06-03 15:51 ?417次閱讀
    基于FPGA搭建<b class='flag-5'>神經網絡</b>的步驟<b class='flag-5'>解析</b>

    BP神經網絡與卷積神經網絡的比較

    BP神經網絡與卷積神經網絡在多個方面存在顯著差異,以下是對兩者的比較: 一、結構特點 BP神經網絡 : BP神經網絡是一種多層的前饋神經網絡
    的頭像 發(fā)表于 02-12 15:53 ?674次閱讀

    BP神經網絡在圖像識別中的應用

    BP神經網絡在圖像識別中發(fā)揮著重要作用,其多層結構使得網絡能夠學習到復雜的特征表達,適用于處理非線性問題。以下是對BP神經網絡在圖像識別中應
    的頭像 發(fā)表于 02-12 15:12 ?682次閱讀

    人工神經網絡的原理和多種神經網絡架構方法

    在上一篇文章中,我們介紹了傳統機器學習的基礎知識和多種算法。在本文中,我們會介紹人工神經網絡的原理和多種神經網絡架構方法,供各位老師選擇。 01 人工神經網絡 ? 人工神經網絡模型之所
    的頭像 發(fā)表于 01-09 10:24 ?1212次閱讀
    人工<b class='flag-5'>神經網絡</b>的原理和多種<b class='flag-5'>神經網絡</b>架構方法

    ElfBoard開源項目|車牌識別項目技術文檔

    車牌識別項目基于百度智能云平臺,旨在利用其強大的OCR服務實現車牌號碼的自動識別。選擇百度智能云的原因是其高效的API接口和穩(wěn)定的服務質量,能夠幫助開發(fā)者快速實現車牌識別應用。這個開源項目
    的頭像 發(fā)表于 12-06 10:30 ?659次閱讀
    ElfBoard開源<b class='flag-5'>項目</b>|車牌<b class='flag-5'>識別項目</b><b class='flag-5'>技術</b>文檔

    卷積神經網絡與傳統神經網絡的比較

    在深度學習領域,神經網絡模型被廣泛應用于各種任務,如圖像識別、自然語言處理和游戲智能等。其中,卷積神經網絡(CNNs)和傳統神經網絡是兩種常見的模型。 1. 結構差異 1.1 傳統
    的頭像 發(fā)表于 11-15 14:53 ?1881次閱讀

    RNN模型與傳統神經網絡的區(qū)別

    神經網絡是機器學習領域中的一種強大工具,它們能夠模擬人腦處理信息的方式。隨著技術的發(fā)展,神經網絡的類型也在不斷增加,其中循環(huán)神經網絡(RNN)和傳統
    的頭像 發(fā)表于 11-15 09:42 ?1133次閱讀

    LSTM神經網絡在語音識別中的應用實例

    語音識別技術是人工智能領域的一個重要分支,它使計算機能夠理解和處理人類語言。隨著深度學習技術的發(fā)展,特別是長短期記憶(LSTM)神經網絡的引入,語音
    的頭像 發(fā)表于 11-13 10:03 ?1855次閱讀

    關于卷積神經網絡,這些概念你厘清了么~

    隨著人工智能(AI)技術的快速發(fā)展,AI可以越來越多地支持以前無法實現或者難以實現的應用。本文基于此解釋了 卷積神經網絡 (CNN)及其對人工智能和機器學習的意義。CNN是一種能夠從復雜數據中提
    發(fā)表于 10-24 13:56

    【飛凌嵌入式OK3576-C開發(fā)板體驗】RKNN神經網絡-車牌識別

    LPRNet基于深層神經網絡設計,通過輕量級的卷積神經網絡實現車牌識別。它采用端到端的訓練方式,不依賴字符分割,能夠直接處理整張車牌圖像,并輸出最終的字符序列。這種設計提高了識別的實時
    發(fā)表于 10-10 16:40

    matlab 神經網絡 數學建模數值分析

    matlab神經網絡 數學建模數值分析 精通的可以討論下
    發(fā)表于 09-18 15:14

    國產芯上運行TinyMaxi輕量級的神經網絡推理庫-米爾基于芯馳D9國產商顯板

    本篇測評由優(yōu)秀測評者“短笛君”提供。本文將介紹基于米爾電子MYD-YD9360商顯板(米爾基于芯馳D9360國產開發(fā)板)的TinyMaxi輕量級的神經網絡推理庫方案測試。 算力測試TinyMaix
    發(fā)表于 08-09 18:26

    FPGA在深度神經網絡中的應用

    隨著人工智能技術的飛速發(fā)展,深度神經網絡(Deep Neural Network, DNN)作為其核心算法之一,在圖像識別、語音識別、自然語言處理等領域取得了顯著成果。然而,傳統的深度
    的頭像 發(fā)表于 07-24 10:42 ?1210次閱讀