深藍詞庫轉換2.8發布——支持微軟拼音自學習詞庫導入導出


Win10自帶的微軟拼音一直以來有不少忠粉,但是詞庫導入導出一直是一個問題,因為微軟拼音的自學習詞庫是自有格式,沒有對外開放,所以一直沒有解決。只能通過自定義短語的形式導入其他輸入法的詞庫到微軟拼音中。

最近經過網友的提醒,再自我研究了幾晚上,終於把微軟拼音的自學習詞庫導入導出解決了。

本次2.8版本的發布主要包含了以下更新:

  • 微軟拼音自學習詞庫的導入和導出。
  • 轉換詞庫時如果某些詞條無法轉換,通過錯誤窗口提示錯誤信息。
  • 增強了微軟拼音自定義短語對多種雙拼方案的支持。
  • 修改持續集成的實現方式,使用GitHub Action實現自動化的測試。

微軟拼音自學習詞庫對詞庫的支持是2W個詞條,所以如果源詞庫太大,則無法導入,所以本轉換工具也做了限制,只支持2W條內的詞庫轉換,如果源詞庫太大,可以通過高級設置中的詞條長度、詞頻等過濾條件,將詞庫控制在2W內。下面以搜狗拼音詞庫轉微軟拼音為例:

搜狗拼音把用戶詞庫導出成bin文件,然后打開深藍詞庫轉換,點擊高級設置的“詞條過濾設置”,設置一個合理的詞頻或者其他過濾,讓最終文件詞條小於2W。

image

然后點擊“轉換”按鈕,完成微軟拼音自學習詞庫的生成。

搜狗轉微軟拼音自學習詞庫

打開微軟拼音的自學習詞庫導入頁面,選擇剛才生成的dat文件,進行導入,幾秒后提示導入成功。

image

最近由於疫情原因,牆的火力很猛,可能無法下載,我這里也放一個下載地址:深藍詞庫轉換2.8


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM