python成長之路第一篇(5)文件的基本操作


一、三元運算 

我們在上章學習的if,,else,,有一種簡便的方法

他的表達式是這樣的:變量 = 值1 if 條件 else 值2

image

解釋過來就是如果aaa等於sss則輸出值1否則輸出值2

二、類的概念

類是面向對象編程的核心, 它扮演相關數據及邏輯的容器角色。它們提供了創建“真實”
對象(也就是實例)的藍圖。對於Python,一切事物都是對象,對象基於類創建。

image

如何查詢對象的類呢?

image

為啥分為有下划線和沒下划線的呢,這些又是什么呢?本例中以查看的是列表的類,那么這個類下面就有了很多的方法也就是下面看到的,帶下划線的為內置方法,不帶下划線的非內置方法只能表示一種方式,只能執行一種方式。也就是說這個變量是列表類型的就能使用這個列表類的所有方法

type:查看對象的類型

dir(類型名)查看類中提供的功能

help(類型名)查看類中所有詳細的功能

help(類型名.功能名稱)查看類中某功能的詳細信息

這里只是了解一下至於功能后續會有專門的文章寫

Pycharm看類的方法:

image

 

三、文件操作

python是怎么操作文件的呢?我們一起來看一下,一般來說對文件的操作有這么幾種讀寫追加

open函數

不同模式打開文件的完全列表:

       模式       描述

r

以只讀方式打開文件。文件的指針將會放在文件的開頭。這是默認模式。

rb

以二進制格式打開一個文件用於只讀。文件指針將會放在文件的開頭。

r+

打開一個文件用於讀寫。文件指針將會放在文件的開頭。

rb+

以二進制格式打開一個文件用於讀寫。文件指針將會放在文件的開頭。

w

打開一個文件只用於寫入。如果該文件已存在則將其覆蓋。如果該文件不存在,創建新文件。

wb

以二進制格式打開一個文件只用於寫入。如果該文件已存在則將其覆蓋。如果該文件不存在,創建新文件。

w+

打開一個文件用於讀寫。如果該文件已存在則將其覆蓋。如果該文件不存在,創建新文件。

wb+

以二進制格式打開一個文件用於讀寫。如果該文件已存在則將其覆蓋。如果該文件不存在,創建新文件。

a

打開一個文件用於追加。如果該文件已存在,文件指針將會放在文件的結尾。也就是說,新的內容將會被寫入到已有內容之后。如果該文件不存在,創建新文件進行寫入。

ab

以二進制格式打開一個文件用於追加。如果該文件已存在,文件指針將會放在文件的結尾。也就是說,新的內容將會被寫入到已有內容之后。如果該文件不存在,創建新文件進行寫入。

a+

打開一個文件用於讀寫。如果該文件已存在,文件指針將會放在文件的結尾。文件打開時會是追加模式。如果該文件不存在,創建新文件用於讀寫。

ab+

以二進制格式打開一個文件用於追加。如果該文件已存在,文件指針將會放在文件的結尾。如果該文件不存在,創建新文件用於讀寫。

打開文件的模式有:

  • r,只讀模式(默認)。
  • w,只寫模式。【不可讀;不存在則創建;存在則刪除內容;】
  • a,追加模式。【可讀;   不存在則創建;存在則只追加內容;】

"+" 表示可以同時讀寫某個文件

  • r+,可讀寫文件。【可讀;可寫;可追加】
  • w+,寫讀
  • a+,同a

"U"表示在讀取時,可以將 \r \n \r\n自動轉換成 \n (與 r 或 r+ 模式同使用)

  • rU
  • r+U

"b"表示處理二進制文件(如:FTP發送上傳ISO鏡像文件,linux可忽略,windows處理二進制文件時需標注)

  • rb
  • wb
  • ab

(1)打開文件

foo = open('test','r') #open是關鍵字,test是文件的名稱,r是打開的模式為只讀
print(foo)

<_io.TextIOWrapper name='test' mode='r' encoding='cp936'>

哦?返回的是什么東東,原來在打開文件后,foo的值等於一個迭代器,迭代器是訪問集合內元素的一種方式。迭代器對象從集合的第一個元素開始訪問,直到所有的元素都被訪問一遍后結束。迭代器不能回退,只能往前進行迭代。

那怎么能夠看到里面的內容呢?非常簡單

(2)加載文件內容到內存

read()函數:

foo = open('test','r')
foo = foo.read()
print(foo)

只需要foo 等於foo.read(),read函數的作用就是從一個打開的文件中讀取一個字符串。

據說有人不喜歡read方式來讀取文件!!這是為什呢呢?

因為:

read()的機制是將文件內容一股腦的讀入內存,滿足不了大家的需求

所以出現了readlines()一次性加載所有內容到內存,並按照行分割,合成列表

readlines()

foo = open('test','r')
ss = foo.readlines()
print(ss)
['a\n', 'bb\n', 'ccc\n', 'dddd\n', 'eeeee']
納尼\n是毛毛啊,哦原來是換行符嚇老子一跳,還有人說了 我就1M的內存讀1G的文件,你不是要我命么,沒關系python還有另外的方法來處理文件
readline()
每次僅讀取一行數據,這樣我們就可以for循環,處理到要處理的內容退出就好了
foo = open('test','r+')
ss = foo.readline()
dd = foo.readline()
print(ss+dd)

a
bb

(3)讀取中文文件

有勤快的小同學就試了試,尼瑪為啥中文文件就報錯呢?其實呢,不是你寫錯的而是編碼問題

①編碼與解碼

對於中文文件編碼格式為gbk,所以在正常的情況下我們使用Pycharm進行調試時用的是uft-8的編碼格式所以會報錯

image

我們知道我們現在一般接觸三種編碼格式分別是,gbk,utf-8,unicode

unicode:萬國碼Unicode 是為了解決傳統的字符編碼方案的局限而產生的,它為每種語言中的每個字符設定了統一並且唯一的二進制編碼,以滿足跨語言、跨平台進行文本轉換、處理的要求。

utf-8:UTF-8用1到6個字節編碼UNICODE字符。用在網頁上可以同一頁面顯示中文簡體繁體及其它語言

GBK:是漢字編碼標准之一中華人民共和國全國信息技術標准化技術委員會1995年12月1日制訂

那么他們之間的關系是什么樣的呢,其實主需要記住一點就好,gbk,utf-8它的源是unicode,所以呢請看下圖

image

decode是解碼,encode是編碼,也就是gbk想要轉換成utf-8就需要先把gbk解碼成unicode,然后unicode在編碼成utf-8,我們來試一下

②python2.7和3.5正常輸出中文的多種方法

這些方法主要目的都是為了把編碼變成utf-8

python2.7:

方法1:在pycharm項目目錄下用windows創建一個txt文件

foo = open('ttt.txt','r')
ss = foo.read().decode('gbk')
print ss


二二
三三三
四四四四
五五五五五
六六六六六六

python3.5:

0.0是不是很郁悶他自己就可以不需要變換編碼

foo = open('ttt.txt','r')
ss = foo.read()
print (ss)
 
codecs函數重點來了:
不管是2.7還是3.5有一些特殊的情況無法輸出中文字符則我們用到codecs這個函數
image 
調用了codecs函數后:
image 
其實呢方法很簡單激素codecs這個函數也提供了open的方法,只需要codecs.open(‘文件名’,’打開模式’,’編碼格式’)就好了。
注意:
使用pycharm切換2.7和3.5的時候可能出現混亂建議實際測試為准
 
(4)寫入操作
python提供了這么多種打開方式,其實常用不沒有幾個r,r+,w,w+,a,a+ 我們一一來看 ①r+啥情況我前面的東西呢!!,額好吧全被替換掉了(推薦測試使用linu畢竟都是運行在linux中
image 
②w,汗以前的內容全被替換掉了,w+就不用測試了吧
image 
③a哦原來追加到最后了為毛不換行!在前面加個\n試試
image 
image 
(5)刪除
對於python來說沒有提供直接刪除文件內容的功能,所以只能使用語句來判斷(反正我是不知道)
例子:反正是特別麻煩后面可以使用with 來優化一下我來解釋一下,首先打開文件,for當i的內容等於ccc\n的情況下什么也不做,否則添加入列表,因為有換行符所以有\n,最后用w+打開文件把列表中的內容寫入進去即可
 1 foo = open('text','r')
 2 aa = foo.readlines()
 3 ccc = []
 4 for i in aa:
 5     if i == 'ccc\n':
 6         continue
 7     else:
 8         ccc.append(i)
 9 foo.close()
10 
11 foe= open('text','w+')
12 for iss in ccc:
13     foe.write(iss)
14 foo.close()
刪除

 

(6)file對象的屬性
以下是和file對象相關的所有屬性的列表:
image 
例子:
fo = open("foo.txt", "r+")
print "文件名: ", fo.name
print "是否已關閉 : ", fo.closed
print "訪問模式 : ", fo.mode
print "末尾是否強制加空格 : ", fo.softspace
結果:
文件名:  foo.txt
是否已關閉 :  False
訪問模式 :  wb
末尾是否強制加空格 :  0

(7)文件定位

大家看到上面的打開方式的列表中有一個這樣的詞語‘指針’,那么這個指針就類似於光標定位的位置,所以在python中,就有這個定位的操作

原文件text

aaa
bbb
ddd
fff

①打開文件,為什這里只輸出了aaa bb呢,是因為read()后面加了個指針,指到了6,所以輸出了這個,有人還問了那指到了6應該輸出三個b啊現在怎么是兩個呢,其實呢是因為你妹的還有個換行符占了個位置

1 foo = open('text','r+')
2 aa = foo.read(6)
3 print(aa)
4 aaa 
5 bb
文件定位-打開文件
② 查找當前位置tell()
foo = open('text','r+')
aa = foo.read(3)
ss = foo.tell()
print(aa,ss)
③把指針再次重新定位到文件開頭
1 foo = open('text','r+')
2 aa = foo.read(3)
3 print(foo.tell())
4 print(aa)
5 foo.seek(0, 0)
6 print(foo.tell())
7 3 
8 aaa 
9 0
重新定位指針

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM