pandas.dataframe重新設置索引，某字段排序，刪除指定行

本文轉載自查看原文 2020-05-21 15:00 3102 python相關

import pandas as pd
import numpy as np
# 導入數據
data = pd.read_excel("C:\\Users\\qianqian.wang\\Desktop\\測試代碼文件夾\\BR-54751\\phone-size.xlsx")
data

# 也就是擁有93種不同的尺寸
data.shape
sum(data["screen_width"] > data["screen_height"])  # 66，黃色部分返回布爾值

# 設定手機寬是大於高的
for i in range(data.shape[0]):
    if data.iloc[i,0]<data.iloc[i,1]:
        temp = data.iloc[i,0]
        data.iloc[i,0] = data.iloc[i,1]
        data.iloc[i,1] = temp
data

按照某個字段排序

#  手機尺寸按照寬 從小到大排序
data = data.sort_values(by="screen_width",ascending=True)
data

修正索引

data.reset_index(drop=True,inplace=True)  # 修正索引
data

計算給定尺寸的占比

import copy
data_copy = copy.deepcopy(data) 
list1 = [1242,1125,1242,750,640,640,640,640,2048,1668,1668,1536,1536,2048,768,768]
list2 = [2688,2436,2208,1334,1096,1136,920,960,2732,2388,2224,2008,2048,1496,1004,1024]

data2 =  copy.deepcopy(data_copy) 

count_people = 0
for i in range(len(list1)):
    temp_index = (list2[i] == data2["screen_width"]) & (list1[i] == data2["screen_height"])  # 返回布爾值
    print("sum(temp_index)",sum(temp_index))
    temp_df = data2[temp_index]
    count_people = sum(temp_df["people"]) + count_people
    print("count_people=",count_people)
    if sum(temp_index) != 0:
        data2.drop(index=temp_df.index,inplace=True)
        print("data2.shape=",data2.shape)
print("percent=",count_people/sum(data["people"]))  # 0.5506492267356433

　　寬和高在加減5mm的情況下屬於同一類

data3 =  copy.deepcopy(data_copy) 
count_people = 0
for i in range(len(list1)):
    temp_index = (list2[i]-5 <= data3["screen_width"]) & (data3["screen_width"] <= list2[i]+5) & (list1[i]-5 <= data3["screen_height"]) & (data3["screen_height"]<= list1[i]+5) # 返回布爾值
    print("sum(temp_index)",sum(temp_index))
    temp_df = data3[temp_index]
    count_people = sum(temp_df["people"]) + count_people
    print("count_people=",count_people)
    if sum(temp_index) != 0:
        data3.drop(index=temp_df.index,inplace=True)   # 刪除指定索引的行
        print("data3.shape=",data3.shape)
print("percent=",count_people/sum(data["people"]))   # 0.7277552800496253

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Pandas之Dataframe疊加，排序，統計，重新設置索引 pandas.DataFrame 插入列和行 pandas.DataFrame刪除/選取含有特定數值的行或列 pandas Dataframe刪除指定列中有空值的行 Mysql查詢按照某字段指定順序排序 Mysql查詢按照某字段指定順序排序 Pandas 如何通過獲取雙(多)重索引獲取指定行DataFrame數據 pandas刪除指定的行,和列按索引和值對Pandas DataFrame進行排序 pandas指定列索引和行索引