字符'\xe5\x8c\x97\xe4\xba\xac\xe6\x96\xb0\xe5\x8d\x8e\xe7\x94\xb5\xe8\x84\x91\xe5\xad\xa6\xe6\xa0\xa1' 转为汉字

本文转载自查看原文 2017-08-31 22:32 6512 python

'\xe5\x8c\x97\xe4\xba\xac\xe6\x96\xb0\xe5\x8d\x8e\xe7\x94\xb5\xe8\x84\x91\xe5\xad\xa6\xe6\xa0\xa1' ，这个是课题里遇到的问题，在招聘数据的薪水这一栏处理的时候有UnicodeError, 所以无法把str的薪水转换成int, 最后找到了这个字符串，正因为有它，所以才报错的，但是他是什么中文？ Python小白表示完全不知道。。。

data = qcwy_df.salary[qcwy_df.salary.str.contains('\xe5\x8c\x97\xe4\xba\xac\xe6\x96\xb0\xe5\x8d\x8e\xe7\x94\xb5\xe8\x84\x91\xe5\xad\xa6\xe6\xa0\xa1', na=False)]
print data.index

这样试也不行，只能转换成中文再找。。。

网上也没搜到，最后竟然试出来了， print unicode('\xe5\x8c\x97\xe4\xba\xac\xe6\x96\xb0\xe5\x8d\x8e\xe7\x94\xb5\xe8\x84\x91\xe5\xad\xa6\xe6\xa0\xa1', 'utf-8')即可。

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。