python print 方法 打印 unicode 遇到的坑


今天使用bs4 寫爬蟲(爬取baidu搜索url),遇到Unicode編碼無法轉正常字體,經過反復排查,發現python2.x版本中的print方法打印書寫格式問題:

def get_maximum_pages(soup_content,link_re):
    div=soup_content.find('div',id='wrapper').find('div',id='wrapper_wrapper').find('div',id='container').find('div',id='page')
    a_list = div.find_all('a')
    next_page = a_list[len(a_list)-1]
    next_text = next_page.get_text()print("next_text:",next_page_text)   //此處無論怎么調試,都一直顯示('next_text:', u'\u4e0b\u4e00\u9875>')

 

1、python2.x 中正確寫法:   

      print "next_text:",next_page_text 

     或者

     print("next_text:"+next_page_text )

    錯誤格式:print("next_text:",next_page_text)


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM