字符'\xe5\x8c\x97\xe4\xba\xac\xe6\x96\xb0\xe5\x8d\x8e\xe7\x94\xb5\xe8\x84\x91\xe5\xad\xa6\xe6\xa0\xa1' 转为汉字


'\xe5\x8c\x97\xe4\xba\xac\xe6\x96\xb0\xe5\x8d\x8e\xe7\x94\xb5\xe8\x84\x91\xe5\xad\xa6\xe6\xa0\xa1' , 这个是课题里遇到的问题, 在招聘数据的薪水这一栏处理的时候有UnicodeError, 所以无法把str的薪水转换成int, 最后找到了这个字符串, 正因为有它, 所以才报错的, 但是他是什么中文? Python小白表示完全不知道。。。

data = qcwy_df.salary[qcwy_df.salary.str.contains('\xe5\x8c\x97\xe4\xba\xac\xe6\x96\xb0\xe5\x8d\x8e\xe7\x94\xb5\xe8\x84\x91\xe5\xad\xa6\xe6\xa0\xa1', na=False)]
print data.index

这样试也不行, 只能转换成中文再找。。。

网上也没搜到, 最后竟然试出来了, print unicode('\xe5\x8c\x97\xe4\xba\xac\xe6\x96\xb0\xe5\x8d\x8e\xe7\x94\xb5\xe8\x84\x91\xe5\xad\xa6\xe6\xa0\xa1', 'utf-8')即可。


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM