【輸入法】向Android端Gboard字典中導入PC端搜狗細胞詞庫
環境
- Android 5.1.1
- Gboard 8.7.10.272217667-release -armeabi-v7a
PC端工具需要
- 詞庫轉換器(深藍詞庫轉換2.6)
- 編輯器(需要有正則表達式的替換功能以及改編字符編碼的功能,個人用的Notepad++7.8)
步驟
1. 在搜狗詞庫官網下載自己需要的細胞詞庫。
文件格式為.scel,雙擊可以導入到搜狗輸入法的詞庫。現在不用雙擊導入,記住文件路徑即可。
2. 用詞庫轉換器將.scel的搜狗細胞詞庫轉為搜狗拼音txt或自定義格式的.txt文件。
- 打開詞庫轉換器,導入搜狗細胞詞庫(可多選),選擇文件時可能要先在右下角選擇文件格式。
- 導出框選擇最下面的“自定義”,進入“自定義詞庫編碼”界面。
- 取消勾選“詞頻”;“每個編碼之間的分隔符”改為“空格”,“編碼漢字詞頻之間的分隔符”改為“Tab”,點擊轉換。
- 導出至.txt文件。
3. 向Gboard的字典中隨便添加一條記錄,以.zip格式導出到電腦並解壓。
好像沒有導出到本地的選項,我導出到了有道雲筆記,然后通過雲同步到了PC端。
4. 參照解壓文件的格式,用編輯器調整剛才第2步的.txt文件(字符編碼、結尾“zh-CN”等)。
- 用編輯器打開,首行粘貼上解壓文件的首行。(可能只是注釋而沒必要粘貼)
- 在編輯器“編碼”中查看是否為UTF-8,不是或不知道的話可以點擊下面的“轉為UTF-8編碼”。
- 在每行結尾添加“zh-CN”:用快捷鍵“Ctrl+H”打開編輯器“替換”功能,勾選左下角的“正則表達式”,查找目標為“$”表示結尾,“替換為”填“\tzh-CN”。(MD檢查點)
5. 將第4步得到的.txt文件壓縮到新的.zip文件,傳到手機中。
最好傳到容易找到的路徑,比如自己在“文件管理”中新建一個文件夾。
6. 在Gboard字典界面選擇導入上一步的.zip文件,此時手機可能會出現一兩分鍾的輕微卡頓和黑屏,耐心等待即可。
我導入的詞庫大約有7K行,黑屏了兩分鍾左右。
7. 檢查一下字典中是否正常,亂碼可能就是第4步字符編碼的問題,清空字典重來。
想清空詞庫不能“刪除用戶詞庫和數據”,只能去手機設置“應用程序管理”中清除Gboard的數據,卸載重新安裝應該也行。