親手擼碼,爬取 手機號碼歸屬地最新數據(201911)


某天,某部門負責人小姐姐:要在訂單中識別收貨人手機號碼歸屬地,這樣可以參考判斷該客戶是否為惡意下單。
搬磚君:可以,有兩種方案;
    一、網上買個API接口(需要RMB支持);
    二、找個手機歸屬地庫(免費,有可能不是最新);
小姐姐:申請RMB,估計領導不會簽字,那就免費的吧。
搬磚君:好吧,(此時心中一萬個。。。(你們懂的));

 

 

 

於是某度搜索 手機號碼歸屬地最新數據庫 排名第一的居然是園子里的高手,瞬間興奮起來,

 

 


打開鏈接看到 github ,心想這下不要去擼碼找數據了。結果翻遍每個文件夾只有查詢方法,卻沒有庫。
再往下看原來庫是有 購買 鏈接,還有升級鏈接。看來這路走不通了。

 

 

再翻了下某度的其它搜索結果,要么不最新,要么收費,要么就是登錄需要積分下載。
心想去找個API接口把他的數據擼出來就好了。 繼續某度 手機號碼歸屬地查詢API接口 ,
經過測試,比對,找了4個可用而且可信度比較高的。

 

 

 

開始擼碼【抱歉,數據源和數據入庫 畫面請各位小伙伴自行腦補】:

private static List<string> MobileList = new List<string>();
// 中途中斷后, 已經存在的手機號段列表
using (SqlConnection conn = new SqlConnection(ConStr))
{
    if (MobileList.Count == 0)
    {
        string temp_sql = $"SELECT [Mobile] From [App_Mobile_20191113]";
        using (SqlCommand command = new SqlCommand(temp_sql, conn))
        {
            command.CommandType = System.Data.CommandType.Text;
            if (conn.State == ConnectionState.Closed) conn.Open();
            using (SqlDataReader dreader = command.ExecuteReader())
            {
                while (dreader.Read())
                {
                    MobileList.Add(dreader[0].ToString());
                }
            }
        }
    }
}

一個號碼段前三位一個線程

List<Task> taskList = new List<Task>();
TaskFactory taskFactory = new TaskFactory();
// 從手機前3位 130 開始 至 199 結束
for (int i = 130; i < 200; i++)
{
    int mobile_no = i;
    taskList.Add(taskFactory.StartNew(() =>
    {
        Console.WriteLine($"{mobile_no} = {Thread.CurrentThread.ManagedThreadId}");
        Get(mobile_no);
    }));
}
Task.WaitAll(taskList.ToArray());

開始獲取數據

static void Get(int start_no)
{
    int start_mobile = int.Parse($"{start_no}0000");
    int end_mobile = int.Parse($"{start_no}9999");
    // 獲取某開頭下的所有號碼段 如: 1300000 - 1309999
    for (int i = start_mobile; i <= end_mobile; i++)
    {
        if (MobileList.Contains(i.ToString())) continue; //已經存在的號碼
        int code = new Random().Next(1000, 9999); // 隨機手機號碼最后4位
        string mobile = $"{i}{code}";
        //獲取數據 【抱歉,數據來源畫面請各位小伙伴自行腦補】
        ModelMobile model = Get1(mobile); // 數據源1
        if (!model.QueryResult || string.IsNullOrWhiteSpace(model.Province)) model = Get2(mobile); // 數據源2
        if (!model.QueryResult || string.IsNullOrWhiteSpace(model.Province)) model = Get3(mobile); // 數據源3
        if (!model.QueryResult || string.IsNullOrWhiteSpace(model.Province)) model = Get4(mobile); // 數據源4
        //獲取成功后入庫【入庫畫面請各位小伙伴自行腦補】
        if (model.QueryResult)
        {
            if (save_data(model))
                Console.WriteLine($" {Thread.CurrentThread.ManagedThreadId}. Success \t{i} = {model.Province} {model.City} ({model.Corp}) [{model.Source}] ......");
            else
                Console.WriteLine($" {Thread.CurrentThread.ManagedThreadId}. SaveFail \t{i} = {model.Province} {model.City} ({model.Corp}) [{model.Source}] ......");
        }
        else
            Console.WriteLine($" {Thread.CurrentThread.ManagedThreadId}. Fail \t{i} = {model.Message} [{model.Source}] ......");
    }
}

運行效果:

 

爬完所有號段后,數據總 442245 條,比某度排第一園子里的高手還要多。

 

 

 

只要源數據正常,這庫還可以一直正常升級。
擼碼完成,敢快去通知小姐姐,已經可以正常調用了。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM