chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

講解霍夫曼編碼提出的思路歷程

LiveVideoStack ? 來源:Reducible ? 作者:Reducible ? 2022-05-18 14:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

該視頻詳細講解了霍夫曼編碼提出的思路歷程。

目錄

故事背景

思路歷程

通信系統(tǒng)示意

衡量信息量

編碼和熵的關(guān)系

香農(nóng)-馮諾編碼

霍夫曼的改進

故事背景1951 年,麻省理工學(xué)院的一名研究生 David Huffman 在 Robert Fano 的信息論課程上名列前茅。Fano 教授讓學(xué)生們在期末考試和學(xué)期論文間做出選擇,年輕的 Huffman 在一開始就選擇了學(xué)期論文。論文的題目如圖 1 所示,給定一組數(shù)字或符號,找到最有效的方法來使用二進制碼表示它們。

dc71761e-d63f-11ec-bce3-dac502259ad0.png

圖 1 Huffman 的學(xué)期論文題目

在基礎(chǔ)層面上,這是一個數(shù)據(jù)壓縮問題。事實上你在計算機上看到的文本和圖像本質(zhì)上都是一組字母、數(shù)字或符號,如果將其歸結(jié)為最簡單的表示形式,那么它們其實都是一組 0 和 1 的組合,每個標(biāo)準的數(shù)據(jù)類型都有一個標(biāo)準的位表示。這個問題的本質(zhì)是將它們壓縮成盡可能少的位數(shù)。這是一個自計算出現(xiàn)以來就存在的問題,但 Fano 沒有告訴學(xué)生的是,這在當(dāng)時是信息論和數(shù)據(jù)壓縮領(lǐng)域的一個未解決的問題。Huffman 在研究生時解決了這個問題,他的解決方案就是大名鼎鼎的霍夫曼編碼算法。

dc95d27a-d63f-11ec-bce3-dac502259ad0.png

圖 2 數(shù)據(jù)壓縮問題

思路歷程通信系統(tǒng)示意在一個通信系統(tǒng)中,我們通常有一個信息發(fā)送方和信息接受方。發(fā)送方想要通過網(wǎng)絡(luò)向接受方發(fā)送一些原始信息,但在網(wǎng)絡(luò)中唯一有意義的信息是二進制比特。因此,發(fā)送方必須根據(jù)符號和二進制代碼間的某種映射對原始信息進行編碼。而接收方需要對二進制代碼進行解碼以恢復(fù)原始信息。

dcb25e04-d63f-11ec-bce3-dac502259ad0.png

圖 3 通信系統(tǒng)示意圖

編碼方法一般針對從原始信息到二進制碼的映射進行優(yōu)化,從原始信息到二進制碼的映射有一些內(nèi)在要求。一是每個符號必須被映射到唯一的二進制碼,二是接收方必須能夠準確解碼出原始信息。霍夫曼編碼算法完全符合這些要求。

衡量信息量對數(shù)據(jù)進行壓縮時,我們需要考慮一種平衡。如果使用太多的比特表示符號,那么會導(dǎo)致冗余;如果使用太少的比特表示,則會導(dǎo)致信息丟失,因此最優(yōu)的無損壓縮算法應(yīng)該在兩者之間找到平衡。那么我們首先需要知道在不丟失原始信息的情況下,最大的壓縮率是多少。對于這個問題,我們可以理解為,需要找到在原始信息中包含的真正的信息量是多少。那我們?nèi)绾魏饬啃畔⒘康亩嗌倌?

dcedc78c-d63f-11ec-bce3-dac502259ad0.png

圖 4 如何衡量信息量

一句話中包含的信息量與文字的長度并沒有直接的關(guān)聯(lián)。如圖 5 所示,對于這兩句話來說,顯然在沙哈拉沙漠下雪所包含的信息量更大,因為在沙漠下雪的概率極小。因此可以想到,事件相關(guān)的信息量與事件發(fā)生的概率有很大的關(guān)系。

dd3df4aa-d63f-11ec-bce3-dac502259ad0.png

圖 5 信息量例子

香農(nóng)根據(jù)信息的性質(zhì)總結(jié)了四個定律:

信息量的大小跟事件發(fā)生的概率反相關(guān)

信息量永遠大于等于 0,因為事件的發(fā)生不會導(dǎo)致信息損失

如果一件事發(fā)生的概率是 100%,那么它不包含任何信息量

如果兩個不相關(guān)事件被分別觀察到,那么它包含的信息量應(yīng)該是這兩個事件單獨信息量的和

香農(nóng)根據(jù)這四個定律給出了自信息的定義。當(dāng)信息以 bit 為單位時,log 函數(shù)的底數(shù)取 2。

dd8492e8-d63f-11ec-bce3-dac502259ad0.png

圖 6 自信息定義

但香農(nóng)更偉大的貢獻在于將自信息推廣到了更廣的分布上,給出了信息熵的概念,也就是著名的香農(nóng)定理。香農(nóng)定理作為信息論的基礎(chǔ),給出了衡量信息量的標(biāo)準公式。

ddb9c4b8-d63f-11ec-bce3-dac502259ad0.png

圖 7 香農(nóng)定理

編碼和熵的關(guān)系當(dāng)衡量不同編碼方式的性能時,我們需要計算不同編碼方式的平均字符長度。在信息論中,我們通常將符號編碼的長度根據(jù)符號出現(xiàn)的概率進行加權(quán)求和得到平均的符號長度。香農(nóng)發(fā)現(xiàn),無論對符號進行哪種方式的無損壓縮編碼,它的長度總是大于等于信息熵,這就是香農(nóng)的源編碼定理。

de0c53d6-d63f-11ec-bce3-dac502259ad0.png

圖 8 香農(nóng)源編碼定理

香農(nóng)-馮諾編碼香農(nóng)-馮諾編碼首先對符號按照概率進行升序排列。然后找到最好的分割方法將符號分為兩組,使得兩組的符號概率和盡可能接近。之后對每個組進行遞歸劃分,直到每個符號都被單獨分為一組。

de29f4ae-d63f-11ec-bce3-dac502259ad0.png

圖 9 香農(nóng)-馮諾編碼分組

分完組之后,編碼就變得很簡單了。從頭部向下,如果向左,那么對符號編碼添加 0,向右走則添加 1,最終可以得到所有符號的二進制編碼。而且對于這個樹形圖的表示,在解碼端是不會存在歧義的。

de44cf90-d63f-11ec-bce3-dac502259ad0.png

圖 10 香農(nóng)-馮諾編碼樹形圖

霍夫曼的改進但是香農(nóng)-馮諾編碼并不總是最優(yōu)的,在思考最小化平均符號長度時,可以想到,兩個最不可能出現(xiàn)的符號應(yīng)該出現(xiàn)在二叉樹的最底部,也就是編碼長度最長的地方。這符合我們的直覺,那就是最不常出現(xiàn)的符號應(yīng)該具有更長的編碼長度。因此我們可以想到,先將兩個最不可能出現(xiàn)的符號放在最底部去構(gòu)建一個二叉樹,然后將這個二叉樹的根節(jié)點視作一個新的符號節(jié)點,該符號節(jié)點的概率是兩個子節(jié)點的和。然后對剩余的符號節(jié)點做相同的操作,直到構(gòu)建出一個完整的二叉樹,這就是霍夫曼編碼。

dea4adca-d63f-11ec-bce3-dac502259ad0.png

圖 11 霍夫曼的改進1

deb44410-d63f-11ec-bce3-dac502259ad0.png

圖 12 霍夫曼的改進2

原文標(biāo)題:[基礎(chǔ)知識] 霍夫曼編碼

文章出處:【微信公眾號:LiveVideoStack】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

審核編輯:湯梓紅
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 通信系統(tǒng)
    +關(guān)注

    關(guān)注

    6

    文章

    1260

    瀏覽量

    55064
  • 編碼
    +關(guān)注

    關(guān)注

    6

    文章

    1034

    瀏覽量

    56808

原文標(biāo)題:[基礎(chǔ)知識] 霍夫曼編碼

文章出處:【微信號:livevideostack,微信公眾號:LiveVideoStack】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    數(shù)字音頻放大器新思路:MAX98360全方位解析

    數(shù)字脈沖編碼調(diào)制(PCM)輸入D類放大器。它就像一顆新星,在音頻放大領(lǐng)域散發(fā)出獨特的魅力,為我們帶來了新的設(shè)計思路和解決方案。 文件下載: MAX98360B.pdf 一、產(chǎn)品概述:性能卓越的數(shù)字音頻利器 MAX98360A/B/C/D可謂是音頻界的“多面手”,它不僅實現(xiàn)
    的頭像 發(fā)表于 01-16 14:15 ?98次閱讀

    E203在基于wallace樹+booth編碼的乘法器優(yōu)化后的跑分結(jié)果

    優(yōu)化思路 E203為了實現(xiàn)低功耗的要求,乘法器為基于booth編碼和移位加法器結(jié)合的思路,優(yōu)點是只需要一個加法器,而且該加法器還和除法器復(fù)用,可以說是將面積縮小到了極致。缺點也很明顯,即使通過
    發(fā)表于 10-27 07:54

    Booth編碼的原理及選擇

    Booth提出該算法的初衷是基于當(dāng)時計算機中的移位運算比加法運算要快這個硬件環(huán)境,其目的是通過移位運算代替部分加法運算來提高乘法運算速度。然而,Booth算法更大的優(yōu)勢在于,它對有符號數(shù)和無符號
    發(fā)表于 10-22 07:53

    絕對值編碼器與增量式編碼器相比有哪些優(yōu)勢?

    絕對值編碼器與增量式編碼器相比有哪些優(yōu)勢?核心功能:斷電后位置信息不丟失,絕對值編碼器:通過機械結(jié)構(gòu)或電子存儲(如電池備份),能實時輸出當(dāng)前位置的唯一絕對值編碼(如二進制、格雷碼)。無
    的頭像 發(fā)表于 08-11 13:57 ?1469次閱讀
    絕對值<b class='flag-5'>編碼</b>器與增量式<b class='flag-5'>編碼</b>器相比有哪些優(yōu)勢?

    絕對值編碼器避坑指南:常見選型誤區(qū)之混淆“分辨率”與“精度”,盲目追求高分辨率

    絕對值編碼器作為精準定位與運動控制的核心部件,其選型直接影響設(shè)備的精度、穩(wěn)定性和壽命。但在實際選型中,由于對技術(shù)參數(shù)、應(yīng)用場景和產(chǎn)品特性的理解偏差,很容易陷入誤區(qū)。本文針對絕對值編碼器選型的常見誤區(qū)之一:混淆“分辨率”與“精度”,盲目追求高分辨率,并提供對應(yīng)的避坑
    的頭像 發(fā)表于 08-04 11:24 ?1010次閱讀
    絕對值<b class='flag-5'>編碼</b>器避坑指南:常見選型誤區(qū)之混淆“分辨率”與“精度”,盲目追求高分辨率

    開關(guān)電源維修思路及常見故障

    開關(guān)電源的維修思路及常見故障處理是電子技術(shù)人員需要掌握的重要技能。以下是對開關(guān)電源維修思路及常見故障的詳細分析。 ? 一、開關(guān)電源維修思路 1. 斷電檢查: ? ? ● ?外觀檢查:打開電源的外殼
    的頭像 發(fā)表于 08-03 07:38 ?2042次閱讀

    求一份CS32A011K8V7的RS485通訊歷程

    求一份CS32A011K8V7的RS485通訊歷程,郵箱:15317208748@163.com
    發(fā)表于 07-17 08:41

    優(yōu)先編碼器:高效數(shù)據(jù)選擇與編碼的解決方案

    在現(xiàn)代數(shù)字電路設(shè)計中,數(shù)據(jù)的選擇與編碼是不可或缺的重要環(huán)節(jié)。面對眾多輸入信號,如何高效地選擇并編碼所需數(shù)據(jù),成為設(shè)計師們面臨的一大挑戰(zhàn)。優(yōu)先編碼器,作為一種獨特的數(shù)字電路組件,憑借其高效、靈活的特點
    的頭像 發(fā)表于 03-25 08:33 ?1053次閱讀

    csu34f20的歷程

    請問csu34f20的歷程哪里有,請發(fā)到2209453423@qq.com謝謝
    發(fā)表于 03-17 16:07

    集成電路和光子集成技術(shù)的發(fā)展歷程

    本文介紹了集成電路和光子集成技術(shù)的發(fā)展歷程,并詳細介紹了鈮酸鋰光子集成技術(shù)和硅和鈮酸鋰復(fù)合薄膜技術(shù)。
    的頭像 發(fā)表于 03-12 15:21 ?1774次閱讀
    集成電路和光子集成技術(shù)的發(fā)展<b class='flag-5'>歷程</b>

    編碼器與無軸承編碼器,到底如何選擇?

    在選擇軸編碼器與無軸承編碼器時,需要根據(jù)具體的應(yīng)用場景、性能需求、環(huán)境條件和成本預(yù)算等因素進行綜合考慮。以下是對兩者的詳細對比,以幫助做出合適的選擇: 一、工作原理與結(jié)構(gòu) 1. 軸編碼
    的頭像 發(fā)表于 03-11 15:33 ?1147次閱讀
    軸<b class='flag-5'>編碼</b>器與無軸承<b class='flag-5'>編碼</b>器,到底如何選擇?

    伺服電機編碼器怎么選型

    伺服電機編碼器的選型是一個綜合性的過程,需要考慮多個因素以確保所選編碼器能夠滿足系統(tǒng)的性能要求。以下是一些關(guān)鍵的選型步驟和考慮因素: 一、明確應(yīng)用需求 首先,需要明確伺服電機編碼器的應(yīng)用需求,包括
    的頭像 發(fā)表于 03-11 12:01 ?1825次閱讀
    伺服電機<b class='flag-5'>編碼</b>器怎么選型

    DISCOAA編碼器性質(zhì)特點

    DISCOAA編碼器的具體詳細資料或參數(shù) ?。不過,我們可以根據(jù)編碼器的通用知識和一些相關(guān)信息來概述編碼器的一般特點和類型。 編碼器通常用于將機械運動或位置轉(zhuǎn)換為電信號,以便進行監(jiān)測、
    的頭像 發(fā)表于 02-20 13:50 ?737次閱讀

    DISCOAA編碼器類型功能

    DISCOAA編碼器可能包括絕對編碼器和增量編碼器兩種類型,其主要功能是將輸入信號進行分析和處理,并將其轉(zhuǎn)換為數(shù)字信號 ?。 關(guān)于類型,雖然搜索結(jié)果中并未直接提及DISCOAA編碼器的
    的頭像 發(fā)表于 02-20 13:47 ?743次閱讀

    信道編碼和信源編碼的區(qū)別

    信道編碼和信源編碼是數(shù)字通信系統(tǒng)中兩個至關(guān)重要的環(huán)節(jié),它們各自承擔(dān)著不同的功能和角色。
    的頭像 發(fā)表于 01-29 16:29 ?3399次閱讀