【Python】使用jieba對文本進行分詞


【參考】

https://blog.csdn.net/u011402896/article/details/79652042

jieba分詞的三種模式

  

# -*- coding:utf-8 -*-
import jieba

import sys
reload(sys)
sys.setdefaultencoding('utf8')

char_x2="考勤機分兩大類:第一類是簡單打印類,打卡時,原始記錄數據通過考勤機直接打印在卡片上,卡片上的記錄時間即為原始的考勤信息,對初次使用者無需做任何事先的培訓即可立即使用;第二類是存儲類,打卡時,原始記錄數據直接存儲在考勤機內,然后通過計算機采集匯總,再通過軟件處理,最后形成所需的考勤信息或查詢或打印,其考勤信息靈活豐富,對初次使用者需做一些事先培訓才能逐漸掌握其全部使用功能。"
test1 = jieba.cut(char_x2, cut_all=True)
print("全模式: " + "| ".join(test1))

test2 = jieba.cut(char_x2, cut_all=False)
print("精確模式: " + "| ".join(test2))

test3= jieba.cut_for_search(char_x2)
print("搜索引擎模式:" + "| ".join(test3))

 

  【打印結果】

全模式: 考勤| 考勤機| 分| 兩大類| 大類| | | 第一| 第一類| 一類| 是| 簡單| 單打| 打印| 類| | | 打卡| 時| | | 原始| 原始記錄| 記錄| 數據| 數據通| 通過| 考勤| 考勤機| 直接| 打印| 在| 卡片| 上| | | 卡片| 上| 的| 記錄| 記錄時間| 時間| 即為| 原始| 的| 考勤| 信息| | | 對| 初次| 使用| 使用者| 用者| 無需| 做| 任何| 何事| 事先| 的| 培訓| 即可| 立即| 即使| 使用| | | 第二| 第二類| 二類| 是| 存儲| 類| | | 打卡| 時| | | 原始| 原始記錄| 記錄| 數據| 直接| 存儲| 在| 考勤| 考勤機| 機內| | | 然后| 通過| 計算| 計算機| 算機| 采集| 匯總| | | 再| 通過| 軟件| 處理| | | 最后| 形成| 所需| 的| 考勤| 信息| 或| 查詢| 或| 打印| | | 其| 考勤| 信息| 靈活| 豐富| | | 對| 初次| 使用| 使用者| 用者| 需| 做| 一些| 事先| 培訓| 才能| 逐漸| 掌握| 其| 全部| 使用| 用功| 功能| | 

精確模式: 考勤機| 分| 兩大類| :| 第一類| 是| 簡單| 打印| 類| ,| 打卡| 時| ,| 原始記錄| 數據| 通過| 考勤機| 直接| 打印| 在| 卡片| 上| ,| 卡片| 上| 的| 記錄時間| 即| 為| 原始| 的| 考勤| 信息| ,| 對| 初次| 使用者| 無需| 做| 任何| 事先| 的| 培訓| 即可| 立即| 使用| ;| 第二類| 是| 存儲| 類| ,| 打卡| 時| ,| 原始記錄| 數據| 直接| 存儲| 在| 考勤機| 內| ,| 然后| 通過| 計算機| 采集| 匯總| ,| 再| 通過| 軟件| 處理| ,| 最后| 形成| 所| 需| 的| 考勤| 信息| 或| 查詢| 或| 打印| ,| 其| 考勤| 信息| 靈活| 豐富| ,| 對| 初次| 使用者| 需做| 一些| 事先| 培訓| 才能| 逐漸| 掌握| 其| 全部| 使用| 功能| 。

搜索引擎模式:考勤| 考勤機| 分| 大類| 兩大類| :| 第一| 一類| 第一類| 是| 簡單| 打印| 類| ,| 打卡| 時| ,| 原始| 記錄| 原始記錄| 數據| 通過| 考勤| 考勤機| 直接| 打印| 在| 卡片| 上| ,| 卡片| 上| 的| 記錄| 時間| 記錄時間| 即| 為| 原始| 的| 考勤| 信息| ,| 對| 初次| 使用| 用者| 使用者| 無需| 做| 任何| 事先| 的| 培訓| 即可| 立即| 使用| ;| 第二| 二類| 第二類| 是| 存儲| 類| ,| 打卡| 時| ,| 原始| 記錄| 原始記錄| 數據| 直接| 存儲| 在| 考勤| 考勤機| 內| ,| 然后| 通過| 計算| 算機| 計算機| 采集| 匯總| ,| 再| 通過| 軟件| 處理| ,| 最后| 形成| 所| 需| 的| 考勤| 信息| 或| 查詢| 或| 打印| ,| 其| 考勤| 信息| 靈活| 豐富| ,| 對| 初次| 使用| 用者| 使用者| 需做| 一些| 事先| 培訓| 才能| 逐漸| 掌握| 其| 全部| 使用| 功能| 。

 

 

 

【待補充】

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM