[轉]DataFrame行遍歷

本文轉載自查看原文 2022-01-08 11:28 1120 python

原文鏈接：https://www.cnblogs.com/math98/p/9769496.html

現有一個數據框pandas的dataframe:

import pandas as pd
inp = [{'c1':10, 'c2':100}, {'c1':11,'c2':110}, {'c1':12,'c2':120}]
df = pd.DataFrame(inp)
print(df)

期望輸出

現在我想遍歷這個數據框的每一行，在每一行當中我想通過列名訪問第一行的每一個元素，例如，實現以下效果：

for row in df.rows:
   print(row['c1'], row['c2'])

方法一：iterrows()，將DataFrame迭代為(insex, Series)對，效率低，不推薦

返回行Series，100W行數據：1分鍾12s，時間花費在類型檢查

這個函數同時返回索引和行對象的生成器可以直接進行遍歷

for index, row in df.iterrows():
     print(index, row['c1'], row['c2'])#字典方式訪問

其中index遍歷的是索引列的值，可以直接訪問索引

方法二：itertuples()，將DataFrame迭代為元祖，效率高，推薦使用

返回行namedtuple，100W行數據：1.78s，時間花在構建namedtuple

用getattr()訪問

student = pd.read_excel('學生ID.xls')
for row in student.itertuples():
    # print(row)
    print(row.Index, row.學生姓名, row.賬號, row.密碼)
    print(row.Index, getattr(row,'學生姓名'), getattr(row,'賬號'), getattr(row,'密碼'))
    break

方法三：for + zip，效率最高，無Index

返回原生元組，100W行數據：1.01s，原生tuple的性能

for A, B in zip(df['A'], df['B']):
    print(A, B)
    break

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 dataframe遍歷行 pandas按行按列遍歷Dataframe pandas中dataframe行遍歷在pandas中遍歷DataFrame行 Python學習筆記：dataframe行遍歷之iterrows pandas按行按列遍歷Dataframe的幾種方式在Pandas Dataframe中遍歷行的不同方法【Spark】遍歷DataFrame中的每一行數據 DataFrame的遍歷 Python的DataFrame遍歷_轉CSDN_J小白Y