[转]算术编码的原理与分析（二）

2011-02-19 17:54阅读：

http://blog.sina.cn/dpool/blog/u/1861838031

转自：http://kulasuki115.blogcn.com/diary,201492702.shtml
2.2、算术编码与Huffman编码的区别　　霍夫曼编码属于码字长度可变的编码类，即从下到上的编码方法。同其他码字长度可变的编码一样，可区别的不同码字的生成是基于不同符号出现的不同概率。生成霍夫曼编码算法基于一种称为“编码树”的技术。算法步骤如下： ① 初始化，根据符号概率的大小按由大到小顺序对符号进行排序。 ② 把概率最小的两个符号组成一个新符号，即新符号的概率等于这两个符号概率之和。 ③ 重复第②步，直到形成一个符号为止，其概率最后等于1。 ④ 从编码树的根开始回溯到原始的符号，并将每一个下分枝赋值为1，上分枝赋值为0。
　　采用霍夫曼编码时有两个问题值得注意： ① 霍夫曼编码没有错误保护功能，在译码时，如果码串中没有错误，那么就能一个接一个地正确译出代码。但如果码串中有错误，哪怕仅仅是 1位出现错误，也会引起一连串的错误，这种现象称为错误传播。计算机对这种错误也无能为力，说不出错在哪里，更谈不上去纠正它。 ② 霍夫曼编码是可变长度码，因此很难随意查找或调用压缩文件中间的内容，然后再译码，这就需要在存储代码之前加以考虑。
　　而算术编码的基本原理是将编码的消息表示成实数0和1之间的一个间隔，消息越长，编码表示它的间隔就越小，表示这一间隔所需的二进制位就越多。算术编码用到两个基本的参数：符号的概率和它的编码间隔。信源符号的概率决定压缩编码的效率，也决定编码过程中信源符号的间隔，而这些间隔包含在0到1之间。编码过程中的间隔决定了符号压缩后的输出。给定事件序列的算术编码步骤如下： ① 编码器在开始时将“当前间隔”[L，H]设置为[0，1]。 ② 对每一事件，编码器按步骤A和B进行处理。 A．编码器将“当前间隔”分为子间隔，每一个事件一个。 B．一个子间隔的大小与下一个将出现的事件的概率成比例，编码器选择子间隔对应于下一个确切发生的事件，并使它成为新的“当前间隔”。③最后输出的“当前

新浪博客

[转]算术编码的原理与分析（二）

分享

我的更多文章

下载客户端阅读体验更佳

疯狂捕鱼