《C# 爬蟲破境之道》：第一境爬蟲原理 — 第一節：整體思路

本文轉載自查看原文 2019-12-24 11:19 230 C# 采集器爬蟲框架/ C# 爬蟲破境之道

　　在構建本章節內容的時候，筆者也在想一個問題，究竟什么樣的采集器框架，才能算得上是一個“全能”的呢？就我自己以往項目經歷而言，可以歸納以下幾個大的分類：

　　以上的分類，也有可能不夠全面，不過應該可以涵蓋主流數據采集的分類了。

　　為了方便闡述一個爬蟲的工作原理，我們從上面找到一條最簡單路徑，來進行闡述（偷奸耍滑？非也，大道化簡，萬變不離其宗：）

　　ＯＫ，一個小目標，單機、單一數據源、定期更新、純文本、HTTP的爬蟲，來一只。

在第一境的后面各節中，我們就來逐步實現這個小目標，同時，也來探究一下其中的原理。只有掌握了這些，才能通過繼續擴展，衍生出強大的爬蟲：）

喜歡本系列叢書的朋友,可以點擊鏈接加入QQ交流群(994761602)【C# 破境之道】
方便各位在有疑問的時候可以及時給我個反饋。同時，也算是給各位志同道合的朋友提供一個交流的平台。
需要源碼的童鞋，也可以在群文件中獲取最新源代碼。

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。