最近我要做一個爬蟲。這個爬蟲需要如下幾個步驟:
1 填寫注冊內容(需要郵箱注冊)
2 過拖拽驗證碼(geetest)
3 注冊成功會給郵箱發一封確認郵箱
4 點擊確認郵箱中的鏈接 完成注冊
我這里就采用163郵箱注冊。
郵箱協議有 pop3 和 imap 和 smtp
我試了pop3 不能夠篩選郵件 例如篩選未讀 和 發件人這2個條件 所以放棄用pop3
imap協議是支持的。
我就找了一個開源的第三方lib:S22.Imap
用法很簡單:
public void Test163() { var imapServer = "imap.163.com"; var port = 993; using (ImapClient client = new ImapClient(imapServer, port, "xxxx@163.com", "pwd", AuthMethod.Login, true)) { // Returns a collection of identifiers of all mails matching the specified search criteria. IEnumerable<uint> uids = client.Search(SearchCondition.Unseen()); // Download mail messages from the default mailbox. IEnumerable<MailMessage> messages = client.GetMessages(uids,FetchOptions.HtmlOnly); Console.WriteLine("We are connected!"); } }
發現 在login的時候 報錯了:
提示“NO Select Unsafe Login. Please contact kefu@188.com for help”。
163郵箱也會收到一個告警郵件
經過查證 發現得需要在發送 login 命令之前 得先發送 id 命令
至於為什么要這么做 我的理解是得先偽裝成普通的客戶端吧(有理解錯誤請指出謝謝)
我fork了一份SS2.imap的代碼 打算兼容163的這個特殊情況改掉源碼
然后走Login方法就不會報錯了
Github地址:https://github.com/yuzd/S22.Imap