前言
emoji也屬於字符串的范圍。
Emoji是用於電子信息和網頁的表意文字和表情符號,起源於20世紀90年代。
安裝
pypi 有現成的庫 emoji 來處理 emoji 字符串:
pip install emoji
函數列表
demojize: 將unicode emoji替換為字符串簡碼用於存儲
emoji_count: 返回字符串中emoji的數量
emoji_lis: 返回字符串中emoji的位置
emojize: 將字符串簡碼替換成unicode emoji
get_emoji_regexp: 返回編譯后的正則表達式,匹配`emoji.UNICODE_EMOJI_ALIAS`
其實emoji庫主要也就是最常用的有兩個函數:
emojize() ——>生成emoji表情
demojize() ——>emoji表情解碼
全部表情
1、共有2811個emoji
import emoji print(len(emoji.EMOJI_UNICODE)) # 2811
2、全部輸出
import emoji for k, v in emoji.EMOJI_UNICODE.items(): print(v, end=' ')
輸出結果:
示例
import emoji print(emoji.emojize('Python is :thumbs_up:')) print(emoji.emojize('Python is :thumbsup:', use_aliases=True)) # 使用別名 print(emoji.demojize('Python is 👍'))
# Python is 👍 # Python is 👍 # Python is :thumbs_up:
輸出結果:
①Windows的PyCharm輸出emoji:
②CentOS 7.4輸出emoji:
③手機輸出emoji:
用Python輸出Emoji表情
1、代碼示例:
print("\U0001F917") print("\U0001F637") print("\U0001F62A") print("\U0001F618") print("\U0001F600")
2、輸出結果:
🤗
😷
😪
😘
😀
3、更多Emoji Unicode編碼請參照:
https://apps.timwhitlock.info/emoji/tables/unicode#block-6c-other-additional-symbols
python之emoji表情處理
源數據:
處理:
我的目的是把emoji表情剃掉,所以還需要用到re庫,re就不詳細敘述了。
# 導入庫 import emoji import re # 打開文件 with open('E:/python練習文件/emoji_txt.txt',encoding='UTF-8') as f: data = f.read() # print(emoji.demojize(data)) #測試一下成功沒?以及看看emoji代碼 content = re.sub('(\:.*?\:)', '', emoji.demojize(data)) print(content)
結果:
源文件
記錄:face_with_tears_of_joy:
嗯嗯
組長:party_popper::party_popper::party_popper:
來吧
回收:face_with_tears_of_joy:
大家記得哈:face_with_tears_of_joy:
你坐哪呢?
處理后
記錄
嗯嗯
組長
來吧
回收
大家記得哈
你坐哪呢?