介紹一下Python在內存中讀寫數據,用到的模塊是StringIO和BytesIO
StringIO
>>> from io import StringIO >>> f = StringIO() >>> f.write('hello') 5 >>> f.write(' ') 1 >>> f.write('world!') 6 >>> print(f.getvalue()) hello world!
getvalue()
方法用於獲得寫入后的str。
要讀取StringIO,可以用一個str初始化StringIO,然后,像讀文件一樣讀取:
>>> from io import StringIO >>> f = StringIO('Hello!\nHi!\nGoodbye!') >>> while True: ... s = f.readline() ... if s == '': ... break ... print(s.strip()) ... Hello! Hi! Goodbye!
BytesIO
StringIO操作的只能是str,如果要操作二進制數據,就需要使用BytesIO。
BytesIO實現了在內存中讀寫bytes,我們創建一個BytesIO,然后寫入一些bytes:
>>> from io import BytesIO >>> f = BytesIO() >>> f.write('中文'.encode('utf-8')) 6 >>> print(f.getvalue()) b'\xe4\xb8\xad\xe6\x96\x87'
請注意,寫入的不是str,而是經過UTF-8編碼的bytes。
和StringIO類似,可以用一個bytes初始化BytesIO,然后,像讀文件一樣讀取:
>>> from io import BytesIO >>> f = BytesIO(b'\xe4\xb8\xad\xe6\x96\x87') >>> f.read() b'\xe4\xb8\xad\xe6\x96\x87'
總結
# stringIO 比如說,這時候,你需要對獲取到的數據進行操作,但是你並不想把數據寫到本地硬盤上,這時候你就可以用stringIO
>>> from io import StringIO >>> from io import BytesIO >>> def outputstring(): return 'string \nfrom \noutputstring \nfunction' >>> s = outputstring()
# 將函數返回的數據在內存中讀
>>> sio = StringIO(s)
# 可以用StringIO本身的方法
>>> print(sio.getvalue()) string from outputstring function
# 也可以用file-like object的方法
>>> s= sio.readlines() >>> for i in s: print(i.strip()) >>>string from outputstring function
# 將函數返回的數據在內存中寫
>>> sio = StringIO() >>> sio.write(s) 36
# 可以用StringIO本身的方法查看
>>> s = sio.getvalue() >>> print(s) string from outputstring function
# 如果你用file-like object的方法查看的時候,你會發現數據為空
>>> sio = StringIO() >>> sio.write(s) 36 >>> for i in sio.readlines(): print(i.strip()) >>>
# 這時候我們需要修改下文件的指針位置 # 我們發現可以打印出內容了
>>> sio = StringIO() >>> sio.write(s) 36 >>> sio.seek(0,0) 0 >>> print(sio.tell()) 0 >>> for i in sio.readlines(): print(i.strip()) string from outputstring function
# 這就涉及到了兩個方法seek 和 tell # tell 方法獲取當前文件讀取指針的位置 # seek 方法,用於移動文件讀寫指針到指定位置,有兩個參數,第一個offset: 偏移量,需要向前或向后的字節數,正為向后,負為向前;第二個whence: 可選值,默認為0,表示文件開頭,1表示相對於當前的位置,2表示文件末尾 # 用seek方法時,需注意,如果你打開的文件沒有用'b'的方式打開,則offset無法使用負值哦
# stringIO 只能操作str,如果要操作二進制數據,就需要用到BytesIO # 上面的sio無法用seek從當前位置向前移動,這時候,我們用'b'的方式寫入數據,就可以向前移動了
>>> bio = BytesIO() >>> bio.write(s.encode('utf-8')) 36 >>> print(bio.getvalue()) b'string \nfrom \noutputstring \nfunction' >>> bio.seek(-36,1) 0 >>> print(bio.tell()) 0 >>> for i in bio.readlines(): print(i.strip()) b'string' b'from' b'outputstring' b'function'