python數據分析-DataFrame數據框常用基本知識（列、行、切片、計算等code）

本文轉載自查看原文 2021-07-02 14:42 797

Python數據分析博文匯總

數據框是用於存儲多行和多列的數據集合

**下列兩部分代碼基本包含了DataFrame的基本操作，練習即可。部分Dataframe高級用法直接參考本博文尾部鏈接 **

    from pandas import DataFrame 
    
    df = DataFrame({
        'age': [21, 22, 23], 
        'name': ['KEN', 'John', 'JIMI']
    })  #導入數據框
    
    df = DataFrame(data={
        'age': [21, 22, 23], 
        'name': ['KEN', 'John', 'JIMI']
    }, index=['first', 'second', 'third']) #自定義index
    
    df['age'] #按列訪問
    
    df[1:2] #按行訪問
    
    df.iloc[0:1, 0:1] #按行列號訪問
    
    df.at[0, 'name'] #按行索引，列名訪問
    
    df.columns=['age2', 'name2']  #修改列名
    
    df.index = range(1,4) #修改行索引
    
    newdf1=df.drop(1, axis=0) #根據行索引刪除
    
    df.drop('age2', axis=1) #根據列名進行刪除
    
    del df['age2']  #第二種刪除列的方法
    
    #增加行，注意，這種方法，效率非常低，不應該用於遍歷中
    df.loc[len(df)] = [24, "KENKEN"]
    
    df['newColumn'] = [2, 4, 6, 8] #增加列
[/code]

```code
    import numpy as np
    import pandas as pd
    
    data = pd.DataFrame(np.arange(16).reshape(4,4),index = list("ABCD"),columns=list('wxyz'))
    print(data[0:2])                       #取前兩行數據
    
    print(len(data))                       #求出一共多少行
    
    print (data.columns.size)              #求出一共多少列
    
    print(data.columns)                    #打印列索引名稱
    
    print(data.index)                      #打印行索引名稱
       
    print(data.iloc[1])                    #取第2行數據
    
    print(data.loc['A'])                   #取第行索引為”A“行數據，
    
    print(data.loc[:,['x','z'] ])          #表示選取所有的行以及columns為x,z的列
    
    print(data.loc[['A','B'],['x','z']])   #表示選取'A'和'B'這兩行以及columns為x,z的列的並集
    
    print (data.iloc[1:3,1:3])              #連續切片操作，取2，3行、2，3列數據
    
    print (data.iloc[[0,2],[1,2]])          #自由選取行位置和列位置對應的數據切片
    
    print(data[data>2])                     #表示選取數據集中大於2的數據
    
    print(data[data.x>5])                   #表示選取數據集中x這一列大於5的所有的行
    
    a1=data.copy()
    print (a1[a1['y'].isin(['6','10'])] )   #表顯示滿足條件：列y中的值包含'6','8'的所有行
    
    print(data.mean())                    #對每一列的數據求平均值
    
    print(data.mean(1))                   #對每一行求平均值
    
    print (data['x'].value_counts())      #統計某一列x中各個值出現的次數
    
    print(data.describe()) #對每一列數據進行統計，包括計數，均值，std，各個分位數等。
    
    data.to_excel(r'D:\1.xls',sheet_name='Sheet')  #數據（dataframe格式）輸出至Excel
[/code]

###  下面三篇原創博文針對更復雜的dataframe數據操作：

  * [ Drop函數與isin函數（DataFrame刪除指定行列） ](https://blog.csdn.net/W_weiying/article/details/84626260)
  * [ DataFrame提取（刪除）指定行列（isin函數、drop函數）（高級用法詳解，示例源碼） ](https://blog.csdn.net/W_weiying/article/details/84618685)
  * [ Pandas中loc和iloc函數用法詳解（源碼+實例） ](https://blog.csdn.net/W_weiying/article/details/81411257)


![在這里插入圖片描述](https://img-blog.csdnimg.cn/20210608151750993.gif)

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 【Python數據分析】時間序列切片與索引基於python的大數據分析基本知識利用Python進行數據分析(5) NumPy基礎: ndarray索引和切片 python科學計算和數據分析常用庫五個 Python 常用數據分析庫數據分析python常用的類庫 Python數據分析-Pandas（Series與DataFrame） python數據分析之pandas庫的DataFrame應用二 Python數據分析-DataFrame的級聯and合並操作 python數據分析之pandas庫的DataFrame應用一