Python爬蟲一:爬取上交所上市公司信息


   前幾天領導讓寫一個從新聞語料中識別上市公司的方案。上市公司屬於組織機構的范疇,組織機構識別屬於命名實體識別的范疇。命名實體識別包括人名、地名、組織機構等信息的識別。

     要想從新聞語料中識別上市公司就需要有上市公司的先驗信息。趁着周末在家沒重要事情,順手寫了個爬蟲,爬取了上海交易所的上市公司的信息。

     好吧,廢話不多說直接上代碼。說明:本次代碼是一次性的,還有優化的空間。例如:多線程。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM