現有一段文言文,要通過二進制哈夫曼編碼進行壓縮。假設這段文言文只由4個漢字“之”“乎”“者”“也”組成,它們出現的次數分別為700、600、300、200。那么,“也”字的編碼長度是(3 )。
哈弗曼編碼的原理需要你自己研究再看看其思想。本題解如圖:
漢字 概率 編碼
之: 700 00
乎: 600 011
者: 300 0101
也: 200 0100
(編碼數如圖這個二叉樹得到,左邊為0,右邊為1,每一個字符都從根節點數)
可以看出:出現次數越多的字符,編碼越短;出現次數越少的字符,編碼越長。這樣就能讓編碼后的文件大小能夠最短。
字符串 "alibaba" 的二進制哈夫曼編碼有多少位 ?