iis服务器助手广告广告
返回顶部
首页 > 资讯 > 前端开发 > VUE >如何正确理解霍夫曼编码
  • 260
分享到

如何正确理解霍夫曼编码

2024-04-02 19:04:59 260人浏览 泡泡鱼
摘要

这篇文章主要讲解了“如何正确理解霍夫曼编码”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“如何正确理解霍夫曼编码”吧!说实话,很早之前我就听说过霍夫曼编码,除

这篇文章主要讲解了“如何正确理解霍夫曼编码”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“如何正确理解霍夫曼编码”吧!

说实话,很早之前我就听说过霍夫曼编码,除了知道它通常用于 GZIP、BZIP2、PKZIP  这些常规的压缩格式中,我还知道它通常用于压缩重复率比较高的字符数据。

大家想啊,英文就 26 个字母进行的无限组合,重复率高得一逼啊!常用的汉字也不多,2500 个左右,别问我怎么知道的,我有问过搜索引擎的。

字符重复的频率越高,霍夫曼编码的工作效率就越高!

是时候,和大家一起来了解一下霍夫曼编码的工作原理啦,毕竟一名优秀的程序员要能做到知其然知其所以然——请允许我又用了一次这句快用臭了话。

假设下面的字符串要通过网络发送。

如何正确理解霍夫曼编码

大家应该知道,每个字符占 8 个比特,上面这串字符总共有 15 个字符,所以一共要占用 15*8=120  个比特。没有疑问吧?有疑问的同学请不好意思下。

如果我们使用霍夫曼编码的话,就可以将这串字符压缩到一个更小的尺寸。怎么做到的呢?

霍夫曼编码首先会使用字符的频率创建一棵树,然后通过这个树的结构为每个字符生成一个特定的编码,出现频率高的字符使用较短的编码,出现频率低的则使用较长的编码,这样就会使编码之后的字符串平均长度降低,从而达到数据无损压缩的目的。

拿上面这串初始字符来一步步的说明下霍夫曼编码的工作步骤。

第一步,计算字符串中每个字符的频率。

如何正确理解霍夫曼编码

B 出现 1 次,C 出现 6 次,A 出现 5 次,D 出现 3 次。

第二步,按照字符出现的频率进行排序,组成一个队列 Q。

如何正确理解霍夫曼编码

出现频率最低的在前面,出现频率高的在后面。

第三步,把这些字符作为叶子节点开始构建一颗树。首先创建一个空节点 z,将最小频率的字符分配给 z 的左侧,并将频率排在第二位的分配给 z 的右侧,然后将  z 赋值为两个字符频率的和。

如何正确理解霍夫曼编码

B 的频率最小,所以在左侧,然后是频率为 3 的 D,在右侧;然后把它们的父节点的值设为 4,子节点的频率之和。

然后从队列 Q 中删除 B 和 D,并将它们的和添加到队列中,上图中 * 表示的位置。紧接着,重新创建一个空的节点 z,并将 4 作为左侧的节点,频率为  5 的 A 作为右侧的节点,4 与 5 的和作为父节点。

如何正确理解霍夫曼编码

继续按照之前的思路构建树,直到所有的字符都出现在树的节点中。

如何正确理解霍夫曼编码

第四步,对于每个非叶子节点,将 0 分配给连接线的左侧,1  分配给连接线的右侧。此时,霍夫曼树就构建完成了。霍夫曼树又称为最优二叉树,是一种带权路径长度最短的二叉树。

如何正确理解霍夫曼编码

当树构建完毕后,我们来统计一下要发送的比特数。

如何正确理解霍夫曼编码

1)来看字符这一列。四个字符 A、B、C、D 共计 4*8=32 比特。每个英文字母均占用一个字节,即 8 个比特。

2)来看频率这一列。A 5 次,B 1 次,C 6 次,D 3 次,一共 15 比特。

3)来看编码这一列。A 的编码为 11,对应霍夫曼树上的 15→9→5,也就是说,从根节点走到叶子节点 A,需要经过 11 这条路径;对应的 B 需要走过  100 这条路径;对应的 D 需要走过 101 这条路径;对应的 C 需要走过 0 这条路径。

4)来看长度这一列。A 的编码为 11,出现了 5 次,因此占用 10 个比特,即 1111111111;B 的编码为 100,出现了 1 次,因此占用  3 个比特,即 100;C 的编码为 0,出现了 6 次,因此占用 6 个比特,即 000000;D 的编码为 101,出现了 3 次,因此占用 9 个比特,即  101101101。

哈夫曼编码从本质上讲,是将最宝贵的资源(最短的编码)给出现概率最多的数据。在上面的例子中,C 出现的频率最高,它的编码为 0,就省下了不少空间。

结合生活中的一些情况想一下,也是这样,我们把最常用的放在手边,这样就能提高效率,节约时间。所以,我有一个大胆的猜想,霍夫曼就是这样发现编码的最优解的。

在没有经过霍夫曼编码之前,字符串“BCAADDDCCACACAC”的二进制为:

10000100100001101000001010000010100010001000100010001000100001101000011010000010100001101000001010000110100000101000011

也就是占了 120 比特。

编码之后为:

0000001001011011011111111111

占了 28 比特。

但考虑到解码,需要把霍夫曼树的结构也传递过去,于是字符占用的 32 比特和频率占用的 15 比特也需要传递过去。总体上,编码后比特数为 32 + 15 +  28 = 75,比 120 比特少了 45 个,效率还是非常高的。

关于霍夫曼编码的 Java 示例,我在这里也贴出来一下,供大家参考。

class Huffmannode {     int item;     char c;     HuffmanNode left;     HuffmanNode right; }  class ImplementComparator implements Comparator<HuffmanNode> {     public int compare(HuffmanNode x, HuffmanNode y) {         return x.item - y.item;     } }  public class Huffman {     public static void printCode(HuffmanNode root, String s) {         if (root.left == null && root.right == null && Character.isLetter(root.c)) {              System.out.println(root.c + "   |  " + s);              return;         }         printCode(root.left, s + "0");         printCode(root.right, s + "1");     }      public static void main(String[] args) {         int n = 4;         char[] charArray = { 'A', 'B', 'C', 'D' };         int[] charfreq = { 5, 1, 6, 3 };          PriorityQueue<HuffmanNode> q = new PriorityQueue<HuffmanNode>(n, new ImplementComparator());          for (int i = 0; i < n; i++) {             HuffmanNode hn = new HuffmanNode();              hn.c = charArray[i];             hn.item = charfreq[i];              hn.left = null;             hn.right = null;              q.add(hn);         }          HuffmanNode root = null;          while (q.size() > 1) {              HuffmanNode x = q.peek();             q.poll();              HuffmanNode y = q.peek();             q.poll();              HuffmanNode f = new HuffmanNode();              f.item = x.item + y.item;             f.c = '-';             f.left = x;             f.right = y;             root = f;              q.add(f);         }         System.out.println(" 字符 | 霍夫曼编码 ");         System.out.println("--------------------");         printCode(root, "");     } }

本例的输出结果如下所示:

字符 | 霍夫曼编码  -------------------- C   |  0 B   |  100 D   |  101 A   |  11

感谢各位的阅读,以上就是“如何正确理解霍夫曼编码”的内容了,经过本文的学习后,相信大家对如何正确理解霍夫曼编码这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是编程网,小编将为大家推送更多相关知识点的文章,欢迎关注!

--结束END--

本文标题: 如何正确理解霍夫曼编码

本文链接: https://www.lsjlt.com/news/83528.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • 如何正确理解霍夫曼编码
    这篇文章主要讲解了“如何正确理解霍夫曼编码”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“如何正确理解霍夫曼编码”吧!说实话,很早之前我就听说过霍夫曼编码,除...
    99+
    2022-10-19
  • java数据结构图论霍夫曼树及其编码示例详解
    目录霍夫曼树一、基本介绍二、霍夫曼树几个重要概念和举例说明 构成霍夫曼树的步骤霍夫曼编码一、基本介绍二、原理剖析注意:霍夫曼编码压缩文件注意事项霍夫曼树 一、基本介绍 二、霍夫曼树...
    99+
    2022-11-12
  • 如何利用Python和C语言分别实现哈夫曼编码
    1.C语言实现1.1代码说明a 创建双向链表:在创建哈夫曼树的过程中,需要不断对结点进行更改和删除,所以选用双向链表的结构更容易'''C #include <stdlib.h> #include <...
    99+
    2023-05-22
    Python C语言
  • 如何正确理解RESTful
    这篇文章主要讲解了“如何正确理解RESTful”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“如何正确理解RESTful”吧! 前言在学习RESTf...
    99+
    2022-10-19
  • 如何正确使用Git管理代码
    这篇文章主要讲解了“如何正确使用Git管理代码”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“如何正确使用Git管理代码”吧!使用场景团队协同开发时,生产环境出现bug,需要紧急修复。每位同学...
    99+
    2023-07-02
  • C++框架该如何正确理解
    本篇文章为大家展示了C++框架该如何正确理解,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。C++编程语言中,有很多比较重要的内容值得我们去深入研究。这些基础内容的理解不但能帮助我们掌握C++,而且还...
    99+
    2023-06-17
  • 如何正确理解python装饰器
    目录一、闭包二、装饰器三、带参数的装饰器四、类装饰器一、闭包 要想了解装饰器,首先要了解一个概念,闭包。什么是闭包,一句话说就是,在函数中再嵌套一个函数,并且引用外部函数的变量,这就是一个闭包了。光说没有概念,直接上...
    99+
    2022-06-02
    python 装饰器
  • 如何正确理解免费建站
    这篇文章主要讲解了“如何正确理解免费建站”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“如何正确理解免费建站”吧!  虽然现在搞互联网都需要烧钱,但是也有一些人希望不需要投入很多钱就能够让自己...
    99+
    2023-06-10
  • 如何正确的理解Java中的继承
    本篇文章为大家展示了如何正确的理解Java中的继承,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。Java作为一面向对象的语言,具备面向对象的三大特征——继承,多态,封装。继承顾名思义,继任,承接,传...
    99+
    2023-05-31
    java ava
  • win10安全模式密码不正确如何解决
    这篇“win10安全模式密码不正确如何解决”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“win10安全模式密码不正确如何解决...
    99+
    2023-06-30
  • PHP编程算法:如何正确处理数据类型?
    在PHP编程中,正确处理数据类型是非常重要的。如果数据类型不正确,将会导致程序出现各种错误,甚至导致系统崩溃。因此,我们需要了解如何正确处理数据类型,以确保我们的程序能够正常运行。 PHP数据类型 PHP中有多种数据类型,包括整型、浮点型...
    99+
    2023-09-10
    编程算法 学习笔记 数据类型
  • 如何解决win10密码正确但是显示错误问题
    小编给大家分享一下如何解决win10密码正确但是显示错误问题,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!win10密码正确但是显示错误的解决办法:1、测试一下注册的微软账号是否能够正确登录;2、检查一下电脑是否联网;3、...
    99+
    2023-06-14
  • win10安全模式密码不正确死循环如何解决
    本文小编为大家详细介绍“win10安全模式密码不正确死循环如何解决”,内容详细,步骤清晰,细节处理妥当,希望这篇“win10安全模式密码不正确死循环如何解决”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。win10...
    99+
    2023-06-30
  • 如何在Go和JavaScript中测试异步编程代码的正确性?
    在当今的软件开发中,异步编程已经成为了一个非常常见的技术。它可以帮助我们更好地处理并发请求、提升性能和响应速度等。但是,异步编程也带来了一些挑战,其中之一就是如何测试异步代码的正确性。在本文中,我们将会讨论在Go和JavaScript中如何...
    99+
    2023-09-26
    javascript 异步编程 http
  • 【恩墨学院】如何理解并正确使用MySql索引
    如何理解并正确使用MySql索引   索引是存储引擎用于快速查找记录的一种数据结构,通过合理的使用数据库索引可以大大提高系统的访问性能,本文主要介绍在MySql数据库中索引类型,以...
    99+
    2022-10-18
  • 如何理解Adsense提升CPC的正确及错误做法
    本篇文章为大家展示了如何理解Adsense提升CPC的正确及错误做法,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。虽然CPC的好与坏并没有一个可以量化的绝对标准,但您还是可以通过一些正确的做法(并避...
    99+
    2023-06-12
  • Java和Git:如何在代码管理中选择正确的路径?
    Java 和 Git: 如何在代码管理中选择正确的路径? 在软件开发中,代码管理是非常重要的一部分。它可以帮助开发者们保持代码的可读性和可维护性,并且能够协同开发。Java 和 Git 是两种常用的工具,它们可以帮助开发者更好地管理代码。但...
    99+
    2023-07-03
    git 编程算法 path
  • 如何正确理解和使用Activity的4种启动模式
    关于Activity启动模式的文章已经很多,但有的文章写得过于简单,有的则过于注重细节,本文想取一个折中,只关注最重要和最常用的概念,原理和使用方法,便于读者正确应用。Activity的启动模式有4种,分别是standard.singleT...
    99+
    2023-05-31
    activity 启动模式
  • 在Linux系统上使用Apache服务器时,如何正确处理ASP文件的编码格式?
    在Linux系统上使用Apache服务器,处理ASP文件的编码格式是一个很重要的问题。ASP文件通常是使用VBScript或JScript编写的,而在不同的编码格式下,ASP文件的解析会有所不同。本文将介绍如何在Linux系统上使用Apa...
    99+
    2023-11-09
    linux apache 文件
  • 如何理解VBScript编码约定
    这篇文章主要介绍“如何理解VBScript编码约定”,在日常操作中,相信很多人在如何理解VBScript编码约定问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”如何理解VBScript编码约定”的疑惑有所帮助!...
    99+
    2023-06-08
软考高级职称资格查询
推荐阅读
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作