推薦系統開發實戰_代碼2-1

本文轉載自查看原文 2020-05-26 11:12 860

　　2020/5/26

最近開始學習推薦系統開發實戰這本書，這是學習的第一個python程序，里面有很多地方需要做筆記。

1、python 中os模塊 os.path.exists() 含義

　　os.path模塊主要用於文件的屬性獲取,exists是“存在”的意思，所以顧名思義，os.path.exists()就是判斷括號里的文件是否存在的意思，括號內的可以是文件路徑。如果不存在，返回的則是FALSE。

2、Python os.listdir() 方法

　　os.listdir() 方法用於返回指定的文件夾包含的文件或文件夾的名字的列表。

3、Python format 格式化函數

4、Python中 with open ( file_abs, 'r' ) as f : 的用法以及意義

　　要以讀文件的模式打開一個文件對象，使用Python內置的open()函數，傳入文件名和標示符：

　　標示符 'r' 表示讀，這樣我們就成功地打開了一個文件。

　　如果文件不存在，open() 函數就會拋出一個 IOError 的錯誤，並且給出錯誤碼和詳細的信息告訴你文件不存在：

　如果文件打開成功，接下來，調用read()方法可以一次讀取文件的全部內容，Python把內容讀到內存，用一個str對象表示：

　　最后一步是調用close()方法關閉文件。文件使用完畢后必須關閉，因為文件對象會占用操作系統的資源，並且操作系統同一時間能打開的文件數量也是有限的：

　　由於文件讀寫時都有可能產生IOError，一旦出錯，后面的f.close()就不會調用。所以，為了保證無論是否出錯都能正確地關閉文件，我們可以使用try ... finally來實現：

　　每次都這么寫實在太繁瑣，所以，Python引入了with語句來自動幫我們調用close()方法：

　　這和前面的try ... finally是一樣的，但是代碼更佳簡潔，並且不必調用f.close()方法。

　　調用read()會一次性讀取文件的全部內容，如果文件有20G，內存就爆了，所以，要保險起見，可以反復調用read(size)方法，每次最多讀取size個字節的內容。

　　另外，調用readline()可以每次讀取一行內容，調用readlines()一次讀取所有內容並按行返回list。因此，要根據需要決定怎么調用。

　　如果文件很小，read()一次性讀取最方便；如果不能確定文件大小，反復調用read(size)比較保險；如果是配置文件，調用readlines()最方便：

　　寫文件：

　　寫文件和讀文件是一樣的，唯一區別是調用open()函數時，傳入標識符'w'或者'wb'表示寫文本文件或寫二進制文件：

　　可以反復調用write()來寫入文件，但是務必要調用f.close()來關閉文件。當我們寫文件時，操作系統往往不會立刻把數據寫入磁盤，而是放到內存緩存起來，空閑的時候再慢慢寫入。只有調用close()方法時，操作系統才保證把沒有寫入的數據全部寫入磁盤。忘記調用close()的后果是數據可能只寫了一部分到磁盤，剩下的丟失了。所以，還是用with語句來得保險：