'\xe5\x8c\x97\xe4\xba\xac\xe6\x96\xb0\xe5\x8d\x8e\xe7\x94\xb5\xe8\x84\x91\xe5\xad\xa6\xe6\xa0\xa1' , 這個是課題里遇到的問題, 在招聘數據的薪水這一欄處理的時候有UnicodeError, 所以無法把str的薪水轉換成int, 最后找到了這個字符串, 正因為有它, 所以才報錯的, 但是他是什么中文? Python小白表示完全不知道。。。
data = qcwy_df.salary[qcwy_df.salary.str.contains('\xe5\x8c\x97\xe4\xba\xac\xe6\x96\xb0\xe5\x8d\x8e\xe7\x94\xb5\xe8\x84\x91\xe5\xad\xa6\xe6\xa0\xa1', na=False)]
print data.index
這樣試也不行, 只能轉換成中文再找。。。
網上也沒搜到, 最后竟然試出來了, print unicode('\xe5\x8c\x97\xe4\xba\xac\xe6\x96\xb0\xe5\x8d\x8e\xe7\x94\xb5\xe8\x84\x91\xe5\xad\xa6\xe6\xa0\xa1', 'utf-8')即可。