chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

為何我們不把機器學習更廣泛地應用在文件壓縮方面呢?

MqC7_CAAI_1981 ? 來源:未知 ? 作者:李倩 ? 2018-11-09 15:45 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

移動互聯(lián)網(wǎng)時代,人類生產的新數(shù)據(jù)正以指數(shù)級別增長,數(shù)據(jù)中心越來越大,并消耗著地球上難以想象的巨大能耗,但人類依然可能面臨著“數(shù)據(jù)無處存放”的境地。

因此,讓文件變小一點,這絕對是個值得投資的點子。

神劇《硅谷》劇組就選中了這個點子。在劇中,幾個主角的得以創(chuàng)業(yè)成功的核心算法——“魔笛”即是選中了“壓縮”這一多數(shù)人都能理解但對技術要求頗高的領域:允許用戶在線將圖片壓縮至一半的大小,并依然保持其清晰度。

“魔笛算法”也一度引發(fā)了不少跟風打造屬于自己的“魔笛手”,此外,包括谷歌等人工智能巨頭公司近年來也在這個領域頻頻發(fā)力。

2016年,谷歌相關團隊推出了一款叫RAISR(Rapid and Accurate Image Super-ResoluTIon)的圖像壓縮技術。希望以人工智能技術作為壓縮路徑,將圖片大小壓縮到源文件的1/4, 但基本不會改變圖片的清晰度。

盡管引來如此高的關注,但很多人還是不認可它會在未來的發(fā)展中取得壓倒性的優(yōu)勢。谷歌的RAISR算法也被不好業(yè)內認識吐槽說“壓縮一張圖片耗時久”、“壓縮后圖片清晰度沒有那么高”等等。

谷歌機器學習工程師、Jetpac創(chuàng)始人Pete Warden近期發(fā)布了一篇文章,認為在短期內壓縮算法可能會成為機器學習應用最可能出現(xiàn)的殺手級應用的領域,他從“壓縮”這一技術的起源開始,希望告訴大家問什么壓縮技術的前景是如此的廣闊。

大數(shù)據(jù)文摘對這篇文章進行了編譯。

OSDI上的一篇文章“神經自適應型內容感知互聯(lián)網(wǎng)視頻傳輸”激發(fā)了我對這一領域的興趣。

這篇文章告訴我們:通過神經網(wǎng)絡,在帶寬相同的條件下,用戶體驗將能提高43%,或者在帶寬縮減17%的條件下可以保持體驗的質量基本不變。還有其他同類的論文將類似方法運用在了生成壓縮或自適應圖像壓縮等方面。他們都展示出了驚人的成果。那么,為何我們不把機器學習更廣泛地應用在文件壓縮方面呢?

我們尚未擁有性能配套的計算設備

上文所提到的所有方法都需要相對較大的神經網(wǎng)絡,并且所需的計算量與像素數(shù)量成正比。這意味著大型圖片文件或每秒幀數(shù)較高的視頻文件可能需要比當前廣泛使用的移動設備更強的計算能力。

現(xiàn)行的大多數(shù)CPU每秒僅能處理百億級的運算,而在高清視頻上用機器學習進行壓縮很輕易便能達到十倍于此的計算量。

當然,好消息是目前我們已經有了一些硬件解決方案,比如Edge TPU等,可以讓我們看到未來達到更多計算量的可能性。我期待這種壓縮方法能夠運用到各種類型文件的壓縮轉換上,從視頻到圖像,到音頻,乃至更多充滿想象力的方式。

自然語言是終極壓縮目標

近來機器學習在自然語言處理中取得了大量有趣的成果。這是另一個讓我覺得機器學習是較為優(yōu)越的壓縮轉換途徑的原因。

如果你稍稍觀察,便會發(fā)現(xiàn)字幕其實是將聲音壓縮為圖像的一種形式。我一直想做一個項目,試圖創(chuàng)造出一種相機,每秒生成一幀字幕,并將所有字幕逐一按行輸出至一個日志文件中。由此便可簡單記錄下基于相機的拍攝內容隨時間的推移而發(fā)生的故事,這可以被定義為一個敘事類的傳感器。

我將這一技術歸類到壓縮方法中的原因是你可以通過生成性的神經網(wǎng)絡將字幕還原為圖像。盡管重新生成的圖像不會跟原圖像完全一致,但也能夠從原圖像繼承一些信息。如果你希望結果與原圖像盡可能接近,你也可以從風格化方面考慮,例如為每個場景生成簡圖。這些技術的共同特征在于他們提取出了輸入文件中對于我們人類重要的部分,并省略了余下的部分。

不僅僅是圖像

語言世界也有類似的趨勢。語音識別正在迅速改進,合成語音的能力也在迅速提高。識別可以看作是將音頻壓縮為自然語言文本的過程,而合成則恰好相反。你可以想象將對話高度壓縮為自然語言文字而非音頻。誠然,我們不需要達到那種要求,但似乎通過擴展我們對于表達的認知類型,我們可以實現(xiàn)在低帶寬情況下的更好的結果。

我甚至還發(fā)現(xiàn)一些有趣的將機器學習應用在文本本身上的可能性。Andrej Karpathy的CHAR-RNN(遞歸神經網(wǎng)絡)展示了神經網(wǎng)絡對某些模板進行模仿的優(yōu)越性,而對于壓縮技術來說,預測也是相同的道理??紤]到普通的HTML頁面有不少冗余,這一情況下GZIP壓縮方法似乎有很大機率能被機器學習改進,盡管我認為這沒有機器學習對文本的處理那么容易。

對于壓縮的研究已立項撥款

在我創(chuàng)業(yè)期間,營銷失敗的經歷讓我學到了一件事:如果已經有一筆預算要購買你所推銷的產品,該產品的銷售會容易得多。預算的存在意味著公司在是否應該花錢購買解決方案上已經贏得了艱難的斗爭,現(xiàn)在唯一的問題是購買哪種解決方案。

這也是我認為機器學習可以在這個領域取得巨大突破的原因之一,因為制造商已經擁有專門用于視頻和音頻壓縮的工程師、資金和芯片。如果我們能夠證明將機器學習添加到現(xiàn)有解決方案中能夠以一些可度量的方式(例如質量、速度或功耗)改進它們,那么它們將被快速采用。

帶寬將會花費用戶和運營商的大量的成本,質量和電池壽命將會成為產品的賣點,因此采用機器學習改進壓縮的優(yōu)勢將比其他運用更為顯而易見。

許多激動人心的研究表明這種方式將會非常高效,而且我樂觀地認為還有許多應用尚未被發(fā)掘。我希望機器學習在壓縮中的應用將發(fā)展成為一門核心技術。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6241

    瀏覽量

    110011
  • 神經網(wǎng)絡

    關注

    42

    文章

    4820

    瀏覽量

    106346
  • 機器學習
    +關注

    關注

    66

    文章

    8532

    瀏覽量

    136018

原文標題:被《硅谷》選中的“壓縮算法”,為什么說下一個機器學習殺手應用將由此誕生

文章出處:【微信號:CAAI-1981,微信公眾號:中國人工智能學會】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    如何促進AI工藝優(yōu)化與協(xié)同應用在不同行業(yè)的發(fā)展?

    促進 AI 工藝優(yōu)化與協(xié)同應用在不同行業(yè)的發(fā)展,需要從政策支持、技術研發(fā)、人才培養(yǎng)、場景應用等多個方面入手。
    的頭像 發(fā)表于 08-29 10:38 ?551次閱讀
    如何促進AI工藝優(yōu)化與協(xié)同<b class='flag-5'>應用在</b>不同行業(yè)的發(fā)展?

    利用NVIDIA推理模型構建AI智能體

    開放式推理模型能夠更快、更廣泛地進行思考,為客戶服務、網(wǎng)絡安全、制造、物流和機器人等領域的 AI 智能體生成更明智的結果。
    的頭像 發(fā)表于 08-13 14:32 ?1129次閱讀
    利用NVIDIA推理模型構建AI智能體

    CMOS的邏輯門如何應用在電路中

    CMOS的邏輯門如何應用在電路中 前言 在如今的電子電路中,CMOS邏輯門有著接近零靜態(tài)功耗和超高集成度的特點,是數(shù)字電路不可或缺的存在。其獨特之處在于PMOS與NMOS晶體管的互補設計:當輸入
    的頭像 發(fā)表于 06-19 16:07 ?1199次閱讀
    CMOS的邏輯門如何<b class='flag-5'>應用在</b>電路中

    人臉識別終端應用在不同領域,有什么優(yōu)勢和注意事項?

    人臉識別技術已廣泛應用在我們日常生活中的方方面面,有著便捷、高效、安全的特點。而且人臉識別可以擺脫一切截止需求,出門就算不帶手機、證件或鑰匙,都能暢通無阻。例如消費支付,以前可能要帶錢包、銀行卡或者
    的頭像 發(fā)表于 04-15 10:24 ?553次閱讀
    人臉識別終端<b class='flag-5'>應用在</b>不同領域,有什么優(yōu)勢和注意事項?

    DLP160CP DMD是否可以應用于機器視覺應用?

    關于DLP160CPDMD芯片有一個疑問, 請問該芯片是否可以應用在機器3D視覺(結構光)場景應用?我在TI TLP機器視覺,“3D掃描視覺機器
    發(fā)表于 02-20 07:39

    請問有什么外部LED驅動器可以應用在這個DLPC350驅動板上?

    DLPC350驅動板上的LED驅動部分有問題,請問有什么外部LED驅動器可以應用在這個驅動板上,適合這個光機系統(tǒng)的?
    發(fā)表于 02-20 06:43

    電路反饋應用在哪些方面

    在當今電子技術飛速發(fā)展的時代,電路反饋作為一項核心技術手段,如同精密儀器中的關鍵齒輪,驅動著各類電子設備高效、精準地運行。 電路反饋的主要應用領域如下: 放大器:負反饋可提高放大器的穩(wěn)定性、線性度及帶寬,減少失真和噪聲,如音頻功率放大器中,能使音頻信號輸出更平穩(wěn);正反饋可增加放大器的增益,如在一些特殊的高頻放大器中可增強信號強度。 振蕩器:正反饋是振蕩器的關鍵,能使電路產生并維持穩(wěn)定的振蕩,輸出周期性信
    的頭像 發(fā)表于 02-04 14:42 ?843次閱讀

    Norflash閃存芯片HT25Q20D廣泛應用在汽車電子領域

    全球NOR Flash市場由四家主要制造商主導,除巨頭之外,還有華芯邦等廠商在市場上也占有一席之地,主要為藍牙、音頻、WIFI等SoC主控芯片生產商供貨,其產品廣泛應用于各種消費電子品牌。例如HT25Q20D廣泛應用在汽車電子領域中。
    的頭像 發(fā)表于 01-13 15:20 ?1134次閱讀
    Norflash閃存芯片HT25Q20D<b class='flag-5'>廣泛應用在</b>汽車電子領域

    華芯邦Norflash閃存芯片HT25Q20D廣泛應用在汽車電子領域,主要為藍牙、音頻、WIFI等SoC主控芯片生產商供貨

    華芯邦Norflash閃存芯片HT25Q20D廣泛應用在汽車電子領域,主要為藍牙、音頻、WIFI等SoC主控芯片生產商供貨,其產品廣泛應用于各種消費電子品牌。
    的頭像 發(fā)表于 01-09 14:45 ?905次閱讀

    請問LDC1000芯片能否應用在高速的環(huán)境中?

    請問LDC1000芯片能否應用在高速的環(huán)境中,例如在10ms的時間中,我要采樣1000個點,來得及嗎?還是說只要單片機頻率夠高就可以啊?
    發(fā)表于 01-07 07:57

    傳統(tǒng)機器學習方法和應用指導

    在上一篇文章中,我們介紹了機器學習的關鍵概念術語。在本文中,我們會介紹傳統(tǒng)機器學習的基礎知識和多
    的頭像 發(fā)表于 12-30 09:16 ?1663次閱讀
    傳統(tǒng)<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法和應用指導

    如何選擇云原生機器學習平臺

    當今,云原生機器學習平臺因其彈性擴展、高效部署、低成本運營等優(yōu)勢,逐漸成為企業(yè)構建和部署機器學習應用的首選。然而,市場上的云原生機器
    的頭像 發(fā)表于 12-25 11:54 ?637次閱讀

    請問ISO7760能應用在USB3.0數(shù)據(jù)上隔離嗎?

    請問ISO7760能應用在USB3.0數(shù)據(jù)上隔離嗎? USB3.0的最大傳輸帶寬高達5.0Gbps而ISO7760手冊上顯示是100Mbps數(shù)據(jù)速率兩者的bps單位一樣,疑惑的是傳輸帶寬和傳輸速率! 請問有那位朋友將ISO7760應用再USB3.0上或者有兼容USB3.0隔離芯片
    發(fā)表于 12-04 08:01

    Linux文件壓縮打包的各種姿勢

    1.文件打包與壓縮 1.什么是文件壓縮? 將多個文件或目錄合并成為一個特殊的文件。比如: 搬家…
    的頭像 發(fā)表于 12-02 09:25 ?1099次閱讀

    什么是機器學習?通過機器學習方法能解決哪些問題?

    來源:Master編程樹“機器學習”最初的研究動機是讓計算機系統(tǒng)具有人的學習能力以便實現(xiàn)人工智能。因為沒有學習能力的系統(tǒng)很難被認為是具有智能的。目前被
    的頭像 發(fā)表于 11-16 01:07 ?1389次閱讀
    什么是<b class='flag-5'>機器</b><b class='flag-5'>學習</b>?通過<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法能解決哪些問題?