Python數據分析博文匯總
- Pandas重復值處理函數drop_duplicates()
- Pandas數據庫缺失值處理函數dropna
- Pandas中slice函數字段抽取
- python數據分析-DataFrame數據框基本知識
- Pandas數據庫數據抽取
- Numpy.random.randint()函數用法及源碼
- Pandas.concat()函數用法及源碼
- Pandas數據框列合並詳解
- Pandas.merge()函數用法及源碼
- Pandas之數據框框運算
- Pandas之數據標准化
- Pandas.cut函數用法及源碼
- python數據框空格值處理
- Pandas.split()函數用法及源碼
- Dataframe指定列轉化為矩陣matrix、數組list
- Python讀取XML中數據提取為Dataframe
- Python提取TXT數據轉化為DataFrame
- Dataframe指定列轉化為矩陣matrix、數組list
更多代碼請關注我的【 Python數據分析專欄
】
數據框是用於存儲多行和多列的數據集合
**下列兩部分代碼基本包含了DataFrame的基本操作,練習即可。 部分Dataframe高級用法直接參考本博文尾部鏈接 **
from pandas import DataFrame
df = DataFrame({
'age': [21, 22, 23],
'name': ['KEN', 'John', 'JIMI']
}) #導入數據框
df = DataFrame(data={
'age': [21, 22, 23],
'name': ['KEN', 'John', 'JIMI']
}, index=['first', 'second', 'third']) #自定義index
df['age'] #按列訪問
df[1:2] #按行訪問
df.iloc[0:1, 0:1] #按行列號訪問
df.at[0, 'name'] #按行索引,列名訪問
df.columns=['age2', 'name2'] #修改列名
df.index = range(1,4) #修改行索引
newdf1=df.drop(1, axis=0) #根據行索引刪除
df.drop('age2', axis=1) #根據列名進行刪除
del df['age2'] #第二種刪除列的方法
#增加行,注意,這種方法,效率非常低,不應該用於遍歷中
df.loc[len(df)] = [24, "KENKEN"]
df['newColumn'] = [2, 4, 6, 8] #增加列
[/code]
```code
import numpy as np
import pandas as pd
data = pd.DataFrame(np.arange(16).reshape(4,4),index = list("ABCD"),columns=list('wxyz'))
print(data[0:2]) #取前兩行數據
print(len(data)) #求出一共多少行
print (data.columns.size) #求出一共多少列
print(data.columns) #打印列索引名稱
print(data.index) #打印行索引名稱
print(data.iloc[1]) #取第2行數據
print(data.loc['A']) #取第行索引為”A“行數據,
print(data.loc[:,['x','z'] ]) #表示選取所有的行以及columns為x,z的列
print(data.loc[['A','B'],['x','z']]) #表示選取'A'和'B'這兩行以及columns為x,z的列的並集
print (data.iloc[1:3,1:3]) #連續切片操作,取2,3行、2,3列數據
print (data.iloc[[0,2],[1,2]]) #自由選取行位置和列位置對應的數據切片
print(data[data>2]) #表示選取數據集中大於2的數據
print(data[data.x>5]) #表示選取數據集中x這一列大於5的所有的行
a1=data.copy()
print (a1[a1['y'].isin(['6','10'])] ) #表顯示滿足條件:列y中的值包含'6','8'的所有行
print(data.mean()) #對每一列的數據求平均值
print(data.mean(1)) #對每一行求平均值
print (data['x'].value_counts()) #統計某一列x中各個值出現的次數
print(data.describe()) #對每一列數據進行統計,包括計數,均值,std,各個分位數等。
data.to_excel(r'D:\1.xls',sheet_name='Sheet') #數據(dataframe格式)輸出至Excel
[/code]
### 下面三篇原創博文針對更復雜的dataframe數據操作:
* [ Drop函數與isin函數(DataFrame刪除指定行列) ](https://blog.csdn.net/W_weiying/article/details/84626260)
* [ DataFrame提取(刪除)指定行列(isin函數、drop函數)(高級用法詳解,示例源碼) ](https://blog.csdn.net/W_weiying/article/details/84618685)
* [ Pandas中loc和iloc函數用法詳解(源碼+實例) ](https://blog.csdn.net/W_weiying/article/details/81411257)
