padans 常用的統計方法


#coding=utf-8
import pandas as pd
import numpy as np

file="./IMDB-Movie-Data.csv"

data=pd.read_csv(file)
print(data.info())

#獲取導演的人數
#一種方法獲取導演列。將其先轉為列表轉為集合(集合里不包括重復元素),然后求len
print(type(data['Director']))
direct=data['Director'].tolist()
print(len(set(direct)))
#第二種方式用本身的函數
d=data['Director']
print(len(d.unique())) #函數unique 是取唯一的意思

#.......................
#獲取演員的人數 演員之間有逗號,先要分割
actor=data['Actors']
actor=actor.str.split(',')
print(actor)
d1=actor.tolist()
d1_1=[i for item in d1 for i in item] #二維數組轉為一維數組
print(len(set(d1_1))) #轉為集合去重 看集合長度

#求電影時長的最大值,和位置

print(data['Runtime (Minutes)'].max())
print(data['Runtime (Minutes)'].idxmax())


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM