二进制哈夫曼编码


现有一段文言文,要通过二进制哈夫曼编码进行压缩。假设这段文言文只由4个汉字“之”“乎”“者”“也”组成,它们出现的次数分别为700、600、300、200。那么,“也”字的编码长度是(3 )。

 

哈弗曼编码的原理需要你自己研究再看看其思想。本题解如图:

汉字    概率      编码

之:    700            00

乎:    600            011

者:    300            0101

也:    200            0100

(编码数如图这个二叉树得到,左边为0,右边为1,每一个字符都从根节点数)

可以看出:出现次数越多的字符,编码越短;出现次数越少的字符,编码越长。这样就能让编码后的文件大小能够最短。

 

字符串 "alibaba" 的二进制哈夫曼编码有多少位 ?

 


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM