C#漢字轉拼音,可識別多音字,帶聲調,提供正向、逆向、雙向分詞算法的小程序


用C#寫了個漢字轉拼音的小工具,和網上大部分工具不同,這個通過分詞算法,解決了多音字的問題,並且提供聲調,可開可關。

如題,用"銀行 行不行 行家說了算"舉例,如果轉拼音卻不能識別多音字,就慘了。

而這個小工具的效果如圖:

C#漢字轉拼音,可識別多音字,帶聲調,提供正向、逆向、雙向分詞算法的小程序

實現了3種分詞算法:
* 正向最大匹配
* 反向最大匹配
* 雙向最大匹配
(這個雙向匹配的歧義處理辦法,還是本人創新。。。)

C#漢字轉拼音,可識別多音字,帶聲調,提供正向、逆向、雙向分詞算法的小程序

 

軟件下載:
 http://pan.baidu.com/s/1mTg3T 

-----------------分割線---------------------

這里,不得不提一下分詞算法這個事情。

不過都寫在這就太長了,還是放到下一篇再談。

-----------------源代碼(含生成好的程序)--------------------

百度網盤:
http://pan.baidu.com/s/1ED1Ls 

騰訊微雲:
http://url.cn/PnnMOU

使用注意:
* bin/release目錄下,已經包含了生成的軟件。

* 顯示拼音時,因為詞庫的中文單字非常不全,我引用了微軟的ChnCharInfo.dll,來獲得一些單字拼音。這個庫是要下載Visual Studio International Pack安裝到系統才會有的。

不過你可以直接從bin/release里面找到,自己重新引用一下就行了。只需要引用: ChnCharInfo.dll,但下面2個文件也不能刪掉ChnCharInfo.xml和zh-CN目錄下的 ChnCharInfo.resources.dll


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM