python處理漢字轉拼音pypinyin


主要是pypinyin 包,官網:  http://pypinyin.readthedocs.io/zh_CN/master/index.html

jieba包,主要是用來分詞的,我之前的博文有介紹:http://www.cnblogs.com/dahu-daqing/p/7491343.html

官網:    https://github.com/fxsjy/jieba/blob/master/README.md

 

就不細講了,軟件包都是中國人寫的,官網也都是中文,看上去無壓力。

放一下我的練習實例:

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# Time    : 17-12-12 下午4:09
# Author  : dahu
# File    : t1pinyin.py
# Software: PyCharm

from pypinyin import lazy_pinyin,pinyin
from pypinyin.style import register
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
@register('kiss')
def kiss(pinyin, **kwargs):
    return '>{0}<'.format(pinyin)
print '自定義格式\t\t',lazy_pinyin(u'么么',style='kiss')
print '字符前加u\t\t',lazy_pinyin(u'呵呵')
a='我的'
print '變量的unicode形式\t\t',lazy_pinyin(unicode(a))
print '默認的輸出格式\t\t',pinyin(unicode(a))

 結果:

/usr/bin/python2.7 /home/dahu/myfile/my_git/core-scrapy-learning/weiboresou/weiboresou/t1pinyin.py
自定義格式        ['>me<', '>me<']
字符前加u        [u'he', u'he']
變量的unicode形式        [u'wo', u'de']
默認的輸出格式        [[u'w\u01d2'], [u'de']]

Process finished with exit code 0

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM