個人 圈外同學 一個簡單的數據分析


原文:圈外的微信群,這里只是作為筆記。



一、背景


1、目標

對拉勾網的【數據分析崗位】上海地區企業分析,需要知道招聘【數據分析崗位】的上海公司所屬【行業類型】

2、大致流程

  1. 后羿采集器抓取數據
  2. Excel對數據分列
  3. Excel建立數據透視表,計算值



二、數據采集


1、准備工具

  1. 目標數據:https://www.lagou.com/jobs/list_數據分析師/p-city_3?&cl=false&fromSearch=true&labelWords=&suginput=

  2. 爬蟲工具:后羿采集器

2、選擇模式,打開后羿采集器,選擇右邊的智能采集模式,點擊開始采集


3、填入數據地址,填入准備好的數據地址,點擊開始創建


4、去頁面廣告

  1. 點擊按鈕預執行操作


  2. 選擇底部左邊按鈕點擊

  3. 再點擊頁面的按鈕給也不要

  4. 選擇左上角的操作提示中的點擊一下

5、清空所有數據,自定義數據列。

  1. 點擊清空所有,即可清空所有字段。
  2. 點擊添加字段,然后鼠標移動到需要抓取的數據那兒即可添加字段。


6、開始采集,保存,然后導出Excel




三、數據分析


1、數據拆分,打開Excel -> 選中目標列 -> 數據 -> 分列 -> 下一步 -> 選擇需要的分隔符 -> 下一步 -> 完成


  1. 分隔符的設置


  2. 原始數據


  3. 處理后的數據


2、建立數據透視表,選擇目標列 -> 數據 -> 數據透視表 -> 確定

  1. 字段列表,選中要顯示的字段
  2. 數據透視表區域,把字段列表的字段,拖入到數據透視表區域那個區域中


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM