【參考】
【https://blog.csdn.net/u011402896/article/details/79652042】
jieba分詞的三種模式
# -*- coding:utf-8 -*- import jieba import sys reload(sys) sys.setdefaultencoding('utf8') char_x2="考勤機分兩大類:第一類是簡單打印類,打卡時,原始記錄數據通過考勤機直接打印在卡片上,卡片上的記錄時間即為原始的考勤信息,對初次使用者無需做任何事先的培訓即可立即使用;第二類是存儲類,打卡時,原始記錄數據直接存儲在考勤機內,然后通過計算機采集匯總,再通過軟件處理,最后形成所需的考勤信息或查詢或打印,其考勤信息靈活豐富,對初次使用者需做一些事先培訓才能逐漸掌握其全部使用功能。" test1 = jieba.cut(char_x2, cut_all=True) print("全模式: " + "| ".join(test1)) test2 = jieba.cut(char_x2, cut_all=False) print("精確模式: " + "| ".join(test2)) test3= jieba.cut_for_search(char_x2) print("搜索引擎模式:" + "| ".join(test3))
【打印結果】
全模式: 考勤| 考勤機| 分| 兩大類| 大類| | | 第一| 第一類| 一類| 是| 簡單| 單打| 打印| 類| | | 打卡| 時| | | 原始| 原始記錄| 記錄| 數據| 數據通| 通過| 考勤| 考勤機| 直接| 打印| 在| 卡片| 上| | | 卡片| 上| 的| 記錄| 記錄時間| 時間| 即為| 原始| 的| 考勤| 信息| | | 對| 初次| 使用| 使用者| 用者| 無需| 做| 任何| 何事| 事先| 的| 培訓| 即可| 立即| 即使| 使用| | | 第二| 第二類| 二類| 是| 存儲| 類| | | 打卡| 時| | | 原始| 原始記錄| 記錄| 數據| 直接| 存儲| 在| 考勤| 考勤機| 機內| | | 然后| 通過| 計算| 計算機| 算機| 采集| 匯總| | | 再| 通過| 軟件| 處理| | | 最后| 形成| 所需| 的| 考勤| 信息| 或| 查詢| 或| 打印| | | 其| 考勤| 信息| 靈活| 豐富| | | 對| 初次| 使用| 使用者| 用者| 需| 做| 一些| 事先| 培訓| 才能| 逐漸| 掌握| 其| 全部| 使用| 用功| 功能| | 精確模式: 考勤機| 分| 兩大類| :| 第一類| 是| 簡單| 打印| 類| ,| 打卡| 時| ,| 原始記錄| 數據| 通過| 考勤機| 直接| 打印| 在| 卡片| 上| ,| 卡片| 上| 的| 記錄時間| 即| 為| 原始| 的| 考勤| 信息| ,| 對| 初次| 使用者| 無需| 做| 任何| 事先| 的| 培訓| 即可| 立即| 使用| ;| 第二類| 是| 存儲| 類| ,| 打卡| 時| ,| 原始記錄| 數據| 直接| 存儲| 在| 考勤機| 內| ,| 然后| 通過| 計算機| 采集| 匯總| ,| 再| 通過| 軟件| 處理| ,| 最后| 形成| 所| 需| 的| 考勤| 信息| 或| 查詢| 或| 打印| ,| 其| 考勤| 信息| 靈活| 豐富| ,| 對| 初次| 使用者| 需做| 一些| 事先| 培訓| 才能| 逐漸| 掌握| 其| 全部| 使用| 功能| 。 搜索引擎模式:考勤| 考勤機| 分| 大類| 兩大類| :| 第一| 一類| 第一類| 是| 簡單| 打印| 類| ,| 打卡| 時| ,| 原始| 記錄| 原始記錄| 數據| 通過| 考勤| 考勤機| 直接| 打印| 在| 卡片| 上| ,| 卡片| 上| 的| 記錄| 時間| 記錄時間| 即| 為| 原始| 的| 考勤| 信息| ,| 對| 初次| 使用| 用者| 使用者| 無需| 做| 任何| 事先| 的| 培訓| 即可| 立即| 使用| ;| 第二| 二類| 第二類| 是| 存儲| 類| ,| 打卡| 時| ,| 原始| 記錄| 原始記錄| 數據| 直接| 存儲| 在| 考勤| 考勤機| 內| ,| 然后| 通過| 計算| 算機| 計算機| 采集| 匯總| ,| 再| 通過| 軟件| 處理| ,| 最后| 形成| 所| 需| 的| 考勤| 信息| 或| 查詢| 或| 打印| ,| 其| 考勤| 信息| 靈活| 豐富| ,| 對| 初次| 使用| 用者| 使用者| 需做| 一些| 事先| 培訓| 才能| 逐漸| 掌握| 其| 全部| 使用| 功能| 。
【待補充】