Python爬蟲(九)_非結構化數據與結構化數據

本文轉載自查看原文 2017-12-03 21:25 2475 python

爬蟲的一個重要步驟就是頁面解析與數據提取。更多內容請參考：Python學習指南

實際上爬蟲一共就四個主要步驟：

以前學的就是如何從網站去爬數據，而爬下來的數據卻沒做分析，現在，就開始對數據做一些分析。

數據，可分為非結構化數據和結構化數據

文本、電話號碼、郵箱地址

HTML文件

JSON文件

XML文件

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 非結構化數據和結構化數據提取結構化數據、非結構化數據之我的理解結構化數據、半結構化數據和非結構化數據什么是結構化數據、半結構化數據與非結構化數據結構化數據、半結構化數據和非結構化數據非結構化數據存儲方案數據類型的多樣性：結構化數據、半結構化數據、非結構化數據 MySQL 5.7：非結構化數據存儲的新選擇非結構化數據與結構化數據提取---正則表達式re模塊 Python之路，Day03-處理結構化數據