pandas數據分析美國各區人口普查案例


需求:

  • 導入文件,查看原始數據
  • 將人口數據和各州簡稱數據進行合並
  • 將合並的數據中重復的abbreviation列進行刪除
  • 查看存在缺失數據的列
  • 找到有哪些state/region使得state的值為NaN,進行去重操作
  • 為找到的這些state/region的state項補上正確的值,從而去除掉state這一列的所有NaN
  • 合並各州面積數據areas
  • 我們會發現area(sq.mi)這一列有缺失數據,找出是哪些行
  • 去除含有缺失數據的行
  • 找出2010年的全民人口數據
  • 計算各州的人口密度
  • 排序,並找出人口密度最高的五個州 df.sort_values()

 

1. 導入文件,查看原始數據

import numpy as np
from pandas import DataFrame,Series
import pandas as pd

2. 將人口數據和各州簡稱數據進行合並

 

3. 將合並的數據中重復的abbreviation列進行刪除

 

4. 查看存在缺失數據的列

 

5. 找到有哪些state/region使得state的值為NaN,進行去重操作

 

6. 為找到的這些state/region的state項補上正確的值,從而去除掉state這一列的所有NaN

 

7. 合並各州面積數據areas

 

8. 我們會發現area(sq.mi)這一列有缺失數據,找出是哪些行

 

9. 去除含有缺失數據的行

 

10. 找出2010年的全民人口數據

 

11. 計算各州的人口密度

 

12. 排序,並找出人口密度最高的五個州 df.sort_values()

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM