黃聰:pycharm開發python 在python Console中輸出的程序有亂碼,含有中文的輸出


  1. 文件編碼是UTF-8,同時在文件頭添加 # -*- coding: utf-8 -*-
  2. 文件中所有的字符串前都加u,如 u"中文"
  3. 在輸入(抓取某些utf-8/gbk的網頁)、輸出(輸出到網頁、終端)的時候,要記住python內部是用Unicode存儲的
  4. 所有輸入要先decode,變成unicode,輸出時要encode變成想要的編碼(MacOS X/Linux下輸出為utf-8,Windows下輸出為gbk,但如果是在pycharm自己的控制台下的話,windows下輸出為utf-8也可以正常顯示)
  5. 還有其他很多種古老的解決方案,比如統一用gbk,比如中轉編碼不用unicode,而用utf-8,如此種種。
  6. 源碼文件用coding: utf-8指定編碼並把文件保存為utf-8格式
  7. 為了作為__main__模塊執行時不出不必要的錯誤,統一使用\n換行
  8. 如果需要在源碼內嵌入漢字等非ascii字符,建議使用u前綴作為unicode字符串,這樣在print時可以可以不做編碼轉換,
  9. 否則如果控制台編碼與源文件編碼不一致就必須顯式轉換,通過locale.getdefaultlocale()可以獲取系統語言和編碼
  10. 涉及文件路徑的最好轉換為sys.getfilesystemencoding()編碼
  11. unicode字符串在寫入文件時必須轉換為某種字節編碼
  12. json默認支持utf-8編碼
  13. 盡量用utf-8和unicode,除了前面說的文件路徑和寫入文件等少數情況


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM