一、文件操作
使用python來讀寫文件使用open()函數來打開一個文件,獲取到文件句柄,然后通過文件句柄就可以進行各種操作了。根據打開方式不同能夠執行的操作也有差異。
打開文件的方式:r, w, a, r+, w+, a+, rb, wb, ab, r+b, w+b, a+b默認使用的是r(只讀)模式
二、只讀操作(r, rb)
file = open("文件名", mode="r", encoding="utf-8") content = file.read() print(content) file.close()
要注意encoding表示編碼集
rb讀取出來的數據是bytes類型,在rb模式下,不能選擇encoding字符集
file = open("文件名", mode="rb") content = file.read() print(content) file.close()
rb的作用是在讀取非文本文件的時候,比如讀取音視頻等信息的時候就要用到rb
讀取文件的方法:
1.read()將文件中的內容全部讀取出來;占內存。如果文件過大,容易導致內存崩潰
2.read(n)讀取n個字符;注意,如果再次讀取就會在當前位置繼續去讀而不是從頭讀,如果是rb模式則讀取出來的是n個字節
3.readline()一次讀取一行數據,每次讀取出來的數據結尾都會有一個\n,所以要使用strip()方法來去掉\n或者空格
4.readlines()將每一行形成一個元素,放到一個列表中;將所有內容都讀取出來,所以也是占內存大
5.循環讀取,這是最建議使用的方式,每次讀取一行內容。
注意:讀取完的文件句柄一定要關閉 f.close()
三、寫模式(w, wb)
寫的時候,如果沒有文件,則會創建文件,如果文件存在,則將原來文件中原內容刪除,再寫入新內容
file = open("文件名", mode="w", encoding="utf-8") file.write("寫內容") file.flush() file.close()
wb模式下可以不指定打開文件的編碼,但是在寫文件的時候必須將字符串轉化成utf8的bytes數據
file = open("文件名", mode="wb") file.write("寫內容".encode("utf-8")) file.flush() file.close()
四、追加(a, ab)
在追加模式下,我們寫入的內容會追加在文件結尾
五、讀寫模式(r+, r+b)
對於讀寫模式,必須是先讀,因為默認光標是在開頭的,准備讀取的;當讀完了之后再進行寫入,使用頻率最高的模式就是r+
file = open("文件名", mode="r+", encoding="utf-8") content = file.read() file.write("寫內容") print(content) file.flush() file.close()
六、寫讀(w+, w+b)
先將所有的內容清空,然后寫入,最后讀取,但是讀取的內容是空的,不常用。
file = open("文件名", mode="w+", encoding="utf-8") file.write("寫內容") content = file.read() print(content) file.flush() file.close()
七、追加讀(a+)
a+模式下,不論先讀還是后讀,都讀取不到數據;
八、其他相關操作
1.seek(n)光標移動到n位置,注意,移動的單位是byte,所以如果是utf-8的中文部分要是3的倍數。
通常我們使用seek都是移動到開頭或者結尾
移動到開頭:seek(0)
移動到結尾:seek(0,2)
seek的第二個參數表示的是從哪個位置進行偏移,默認是0表實從開頭,1表示當前位置,2表示結尾
file = open("文件名", mode="r+", encoding="utf-8") file.seek(0) # 光標移動到開頭 content = file.read() # 讀取內容,此時光標移動到結尾 print(content) file.seek(0) # 再次將光標移動到開頭 file.seek(0,2) # 將光標移動到結尾 content2 = file.read() # 讀取內容,什么都沒有 print(content2) file.seek(0) # 移動到開頭 file.write("新寫內容") # 寫入信息,此時光標在9,中文3*3 file.flush() file.close()
2.tell() 可以獲取到當前光標在什么位置
file = open("文件名", mode="r+", encoding="utf-8") file.seek(0) # 光標移動到開頭 content = file.read() # 讀取內容,此時光標移動到結尾 print(content) file.seek(0) # 再次將光標移動到開頭 file.seek(0,2) # 將光標移動到結尾 content2 = file() # 讀取內容,什么都沒有 print(content2) file.seek(0) file.write("寫內容") print(file.tell()) # 光標位置 file.flush() file.close()
3.truncate()截斷文件
如果想做截斷的時候,要先移動光標,挪動到想要截斷的位置再進行截斷;
truncate(n),如果給出了n,則從開頭進行截斷,如果不給n,則從當前位置截斷,后面的內容將會被刪除;
注意:在r+模式下,如果讀取了內容,不論讀取內容多少,光標顯示的是多少,再寫入或者操作文件的時候都是再結尾進行的操作。
九、修改文件以及另一種打開文件的方式
文件修改只能將文件中的內容讀取到內存中,將信息修改完畢后再將源文件刪除,將新文件的名字改成老文件的名字
import os with open("文件名", mode="r", encoding="utf-8") as file1,\ open("文件名_new", mode="w", encoding="UTF-8") as file2: for line in f1: new_line = line.replace("大白梨", "冰糖葫蘆") file2.write(new_line) os.remove("文件名") # 刪除源⽂文件 os.rename("文件名_new", "文件名") # 重命名新⽂文件
