exception2:UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd7 in position 0: invalid continuation byte


起因:jieba.load_userdict('C:\\Users\\lim\\Desktop\\dict.txt')

异常描述:

由异常描述可知,结巴默认的是使用“utf-8”来打开文件,因此我们需要修改文件的编码

属于编码解码的问题,默认的会跟随系统使用GBK,需要修改成UTF-8

首先在文件的开始添加:# -*- coding: utf-8 -*-

然后将文件的编码修改为UTF-8


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM