(一)Series初始化
1.通過列表,index自動生成
se = pd.Series(['Tom', 'Nancy', 'Jack', 'Tony']) print(se)
2.通過列表,指定index
se = pd.Series(['Tom', 'Nancy', 'Jack', 'Tony'], index=['idx_a', 'idx_b', 'idx_c', 'idx_d']) print(se)
3.通過字典,字典的key為Series的index
se = pd.Series({'a': 'Tom', 'b': 'Nancy', 'c': 'Jack', 'd': 'Tony'}) print(se)
4.通過迭代器,index自動生成
se = pd.Series(range(4)) print(se)
5.通過numpy.arange,index自動生成
se = pd.Series(np.arange(4)) print(se)
(二)Dataframe初始化
1.1 通過列表,columns及index自動生成
df = pd.DataFrame([['Tom', 16], ['Nancy', 18], ['Jack', 15]]) print(df)
1.2 通過列表,指定columns
df = pd.DataFrame([['Tom', 16], ['Nancy', 18], ['Jack', 15]], columns=['stu_name', 'stu_age']) print(df)
1.3 通過列表,指定index
df = pd.DataFrame([['Tom', 16], ['Nancy', 18], ['Jack', 15]], index=['idx_a', 'idx_b', 'idx_c']) print(df)
1.4 通過列表,指定columns跟index
df = pd.DataFrame([['Tom', 16], ['Nancy', 18], ['Jack', 15]], columns=['stu_name', 'stu_age'], index=['idx_a', 'idx_b', 'idx_c']) print(df)
2.1 通過字典,字典key為column,index自動生成
df = pd.DataFrame({'stu_name': ['Tom', 'Nancy', 'Jack', 'Tony'], 'stu_age': [16, 18, 15, 20]}) print(df)
2.2 通過字典,字典key為column,並指定index
df = pd.DataFrame({'stu_name': ['Tom', 'Nancy', 'Jack', 'Tony'], 'stu_age': [16, 18, 15, 20]}, index=['a', 'b', 'c', 'd']) print(df)
3. 通過值為字典的列表,一個字典為一行,列數目不相等自動補充NaN
df = pd.DataFrame([{'col1': 1, 'col2': 2}, {'col1': 5, 'col2': 10, 'col3': 20}, {'col1': 98, 'col2': 99}]) print(df)
4. 通過迭代器
df = pd.DataFrame({'col1': range(3), 'col2': range(3)}) print(df)
5. 通過numpy.arange
df = pd.DataFrame({'col1': np.arange(3), 'col2': np.arange(5, 8)}) print(df)
6. 讀取csv
df = pd.read_csv('test.csv')