需求:
- 導入文件,查看原始數據
- 將人口數據和各州簡稱數據進行合並
- 將合並的數據中重復的abbreviation列進行刪除
- 查看存在缺失數據的列
- 找到有哪些state/region使得state的值為NaN,進行去重操作
- 為找到的這些state/region的state項補上正確的值,從而去除掉state這一列的所有NaN
- 合並各州面積數據areas
- 我們會發現area(sq.mi)這一列有缺失數據,找出是哪些行
- 去除含有缺失數據的行
- 找出2010年的全民人口數據
- 計算各州的人口密度
- 排序,並找出人口密度最高的五個州 df.sort_values()
1. 導入文件,查看原始數據
import numpy as np from pandas import DataFrame,Series import pandas as pd
2. 將人口數據和各州簡稱數據進行合並
3. 將合並的數據中重復的abbreviation列進行刪除
4. 查看存在缺失數據的列
5. 找到有哪些state/region使得state的值為NaN,進行去重操作
6. 為找到的這些state/region的state項補上正確的值,從而去除掉state這一列的所有NaN
7. 合並各州面積數據areas
8. 我們會發現area(sq.mi)這一列有缺失數據,找出是哪些行
9. 去除含有缺失數據的行
10. 找出2010年的全民人口數據
11. 計算各州的人口密度
12. 排序,並找出人口密度最高的五個州 df.sort_values()