【python小隨筆】re模塊中,以什么開頭以什么結尾取中間內容


from lxml import etree
import requests
import re
headers = {
    'user-agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.131 Safari/537.36',
}
#session請求 拿到cookies
sessions = requests.Session() #創建一個session對象

# sessions.get(z_url,headers=headers)  #發送請求


url = 'http://www.agri.cn/V20/SC/jcyj_1/'

ret = sessions.get(url=url,headers=headers)
ret.encoding="utf-8"
ret_text =ret.text


tree= etree.HTML(ret_text)
#

li_list = tree.xpath('/html/body/table[3]//tr/td[1]/table[2]//tr/td/table[2]//tr/td[1]/a/script/text()')[0]
print(li_list)
# document.write(tit1_('<a href="./202005/t20200513_7387962.htm">5月份第1周畜產品和飼料集貿市場價格情況</a>')); 

dta = re.findall('htm">(.*)</a>',li_list)
print(dta)
# ['5月份第1周畜產品和飼料集貿市場價格情況']

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM