把搜狗輸入法詞庫導入Google拼音輸入法


        <h1 id="為PC端Google拼音輸入法增加詞庫"><a href="#為PC端Google拼音輸入法增加詞庫" class="headerlink" title="為PC端Google拼音輸入法增加詞庫"></a>為PC端Google拼音輸入法增加詞庫</h1><h2 id="為什么折騰詞庫"><a href="#為什么折騰詞庫" class="headerlink" title="為什么折騰詞庫"></a>為什么折騰詞庫</h2><p>都在說百度、訊飛等輸入法上傳用戶詞庫,為了安全建議大家使用google輸入法之類,話說回來,要想使用智能聯想功能是不是就得把你輸入習慣放在他的里面跑一圈才能知道你的輸入習慣吧?</p>

用什么輸入法都是個人習慣,不過自打有了智能ABC拼音輸入法的時候已經有本機記錄輸入詞頻的功能,個人還是喜歡Google拼音輸入法,電腦端、手機端(我不是miboy)都安裝。

因為各種原因,目前google拼音輸入法的詞庫同步功能無法使用,重裝系統之后除了把自己備份的詞庫手動導入之外,顯得詞庫太瘦,由studyzy在github上發布的imewlconverter深藍詞庫轉換工具:

一款輸入法詞庫轉換軟件,支持以下超過20種的輸入法工具和詞庫

有了這個神器,就有想把搜狗詞庫下載下來。

開始手工活

通過搜狗細胞詞庫頁面


通過查看網頁源代碼查找

/dict/cate/index/

可以看到,有下面幾大類:

  • 人文科學
  • 農林漁畜
  • 醫學
  • 城市信息大全
  • 娛樂
  • 工程與應用科學
  • 生活
  • 電子游戲
  • 社會科學
  • 自然科學
  • 藝術
  • 運動休閑

可以進一步看到每一類的單獨頁面是:

找到子類

里面的數字相當於是他的ID,點擊進入每個大類,會打開對應的每一個細類,在細類頁面找到每一類的總頁數,例如,總頁數是10頁,每一頁的具體頁面是:

詞庫下載地址

在子類的每一個頁面查找:

<div class="detail_title"><a href=

找到分頁面里的詞庫名稱:

http://pinyin.sogou.com//dict/detail/index/15206 動物詞匯大全【官方推薦】
http://pinyin.sogou.com//dict/detail/index/15208 地理地質詞匯大全【官方推薦】
http://pinyin.sogou.com//dict/detail/index/15124 生物詞匯大全【官方推薦】
http://pinyin.sogou.com//dict/detail/index/15205 化學化工詞匯大全【官方推薦】
http://pinyin.sogou.com//dict/detail/index/15202 數學詞匯大全【官方推薦】
http://pinyin.sogou.com//dict/detail/index/15203 物理詞匯大全【官方推薦】
http://pinyin.sogou.com//dict/detail/index/15207 植物詞匯大全【官方推薦】
http://pinyin.sogou.com//dict/detail/index/15204 天文詞匯大全【官方推薦】
http://pinyin.sogou.com//dict/detail/index/15120 氣象詞匯大全【官方推薦】
http://pinyin.sogou.com//dict/detail/index/20660 測繪詞匯大全【官方推薦】

對應的下載地址繼續查找:

<div class="dict_dl_btn"><a href="

對應的下載地址是:

http://download.pinyin.sogou.com/dict/download_cell.php?id=15206&name=%E5%8A%A8%E7%89%A9%E8%AF%8D%E6%B1%87%E5%A4%A7%E5%85%A8%E3%80%90%E5%AE%98%E6%96%B9%E6%8E%A8%E8%8D%90%E3%80%91
http://download.pinyin.sogou.com/dict/download_cell.php?id=15208&name=%E5%9C%B0%E7%90%86%E5%9C%B0%E8%B4%A8%E8%AF%8D%E6%B1%87%E5%A4%A7%E5%85%A8%E3%80%90%E5%AE%98%E6%96%B9%E6%8E%A8%E8%8D%90%E3%80%91
http://download.pinyin.sogou.com/dict/download_cell.php?id=15124&name=%E7%94%9F%E7%89%A9%E8%AF%8D%E6%B1%87%E5%A4%A7%E5%85%A8%E3%80%90%E5%AE%98%E6%96%B9%E6%8E%A8%E8%8D%90%E3%80%91
http://download.pinyin.sogou.com/dict/download_cell.php?id=15205&name=%E5%8C%96%E5%AD%A6%E5%8C%96%E5%B7%A5%E8%AF%8D%E6%B1%87%E5%A4%A7%E5%85%A8%E3%80%90%E5%AE%98%E6%96%B9%E6%8E%A8%E8%8D%90%E3%80%91
http://download.pinyin.sogou.com/dict/download_cell.php?id=15202&name=%E6%95%B0%E5%AD%A6%E8%AF%8D%E6%B1%87%E5%A4%A7%E5%85%A8%E3%80%90%E5%AE%98%E6%96%B9%E6%8E%A8%E8%8D%90%E3%80%91
http://download.pinyin.sogou.com/dict/download_cell.php?id=15203&name=%E7%89%A9%E7%90%86%E8%AF%8D%E6%B1%87%E5%A4%A7%E5%85%A8%E3%80%90%E5%AE%98%E6%96%B9%E6%8E%A8%E8%8D%90%E3%80%91
http://download.pinyin.sogou.com/dict/download_cell.php?id=15207&name=%E6%A4%8D%E7%89%A9%E8%AF%8D%E6%B1%87%E5%A4%A7%E5%85%A8%E3%80%90%E5%AE%98%E6%96%B9%E6%8E%A8%E8%8D%90%E3%80%91
http://download.pinyin.sogou.com/dict/download_cell.php?id=15204&name=%E5%A4%A9%E6%96%87%E8%AF%8D%E6%B1%87%E5%A4%A7%E5%85%A8%E3%80%90%E5%AE%98%E6%96%B9%E6%8E%A8%E8%8D%90%E3%80%91
http://download.pinyin.sogou.com/dict/download_cell.php?id=15120&name=%E6%B0%94%E8%B1%A1%E8%AF%8D%E6%B1%87%E5%A4%A7%E5%85%A8%E3%80%90%E5%AE%98%E6%96%B9%E6%8E%A8%E8%8D%90%E3%80%91
http://download.pinyin.sogou.com/dict/download_cell.php?id=20660&name=%E6%B5%8B%E7%BB%98%E8%AF%8D%E6%B1%87%E5%A4%A7%E5%85%A8%E3%80%90%E5%AE%98%E6%96%B9%E6%8E%A8%E8%8D%90%E3%80%91

給每個下載地址加入“.scel”后綴,放到迅雷里進行下載。

用到的工具

pycharm

找到子類分頁面之后,通過python的request包把頁面源代碼下載到本地。(python連初學都算不上)

ultraedit

通過ultraedit的在文件中查找功能找到子類名稱、詞庫名稱和下載地址。

迅雷

在下載鏈接中加入scel后綴之后加入迅雷進行下載。
PS:詞庫有重復的。

按鍵精靈

迅雷下載時會提示有重復任務,問是否需要繼續,用按鍵精靈錄制了一個鼠標點擊動作。

后記

一共找到6912個詞庫,自己下載了2000個。

書到讀時方恨少,python應該可以一次搞定這個事情,這里算是用打補丁的方式做了。

</div>


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM