Python中基本的讀文件和簡單數據處理


Python中基本的讀文件和簡單數據處理

DataQuest上面的免費課程(本文是Python基礎課程部分),里面有些很基礎的東西(csv文件讀,字符串預處理等),發在這里做記錄。涉及下面六個案例:

  1. Find the lowest crime rate(讀取csv文件,字符串切分,for循環和if判斷過濾數據)
  2. Discover weather pattern in LA(for循環和if判斷進行頻數統計)
  3. Building a Spell Checker(詞頻統計,字符串預處理,字典跑字符串,統計正確錯誤單詞)
  4. Analyze NFL data(使用CSVmodule導入文件,類,函數,使用字典和list進行簡單統計)
  5. What should you name your kid if you want them to be a US Congressperson?(數據預處理,強制類型轉換int(),try-except語句,字典方式統計,轉存需要數據)
  6. Which airline is delayed the most?
  7. 附錄:逐行讀取txt文件

 

案例1 Find the lowest crime rate

(讀取csv文件,字符串切分,for循環和if判斷過濾數據)

crime_rates.csv是單sheet,73Rows,2Cols的文件。第一列是城市名稱(字符串),第二列是犯罪數量(整數)。但是讀入Python開始都是字符串,在后面類型轉換將字符串形式的犯罪數量強制轉換成整型。 並將分隔開轉換后的數據存到full_data這個list中,然后使用for循環將犯罪數量最小的城市找出來(if判斷,已知犯罪數最小為130),並將這個城市名存入變量city中。

 

案例2 Discover weather pattern in LA

(for循環和if判斷進行頻數統計)

兩列數據的文本文件,有表頭。導入la_weather.txt文本文件,切分,存入變量weather_data中,去掉表頭。使用字典(dictionary)進行不同類型的頻數統計。

 

案例3 Building a Spell Checker

(詞頻統計,字符串預處理,字典跑字符串,統計正確錯誤單詞)

 

 

 案例4 Analyze NFL data

(使用CSVmodule導入文件,類,函數,使用字典和list進行簡單統計)

 

 

 案例5 What should you name your kid if you want them to be a US Congressperson?

(數據預處理,強制類型轉換int(),try-except語句,字典方式統計,轉存需要數據)

 

 

案例6 Which airline is delayed the most?

這個案例來來回回做了好幾天,反正基本上大都是參考答案做過的……醬油了……

 

附錄1 逐行讀取txt文件

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM