Python 文件導入、保存


菜鳥教程:https://www.runoob.com/python/os-chdir.html
Python官方文件教程:https://docs.python.org/3.9/library/os.html?highlight=os chdir#os.chdir
Datascience:https://betterprogramming.pub/the-top-10-file-handling-techniques-in-python-cf2330a16e7


路徑設置

在使用Python時,我們可以爬取網頁上的數據,也可以使用電腦本地的數據,Python安裝時,需要配置環境,使用Anaconda安裝,Anaconda會幫你配置好環境,這時配置的環境中的路徑就是Python的默認工作路徑。

在參考大佬的Python code時,每個電腦的默認路徑是不同的,這時我們需要告訴Python,本地文件的路徑具體在哪里!這時需要用到os.chdir("path")path為文件所在的位置,\\表示下一層級,也可以使用/

import os
os.chdir("D:\\研究生課程\\研一小學期\\SDA\\Homework\\hw3")

可以用下列命令測試我們是否已經更改默認路徑。

sub_dir = os.getcwd()  # 獲得默認路徑
print(sub_dir)
# os.path.exists(sub_dir) 如果是 True ,將sub_dir賦值給cwd_dir,否則將os.getcwd()賦值給cwd_dir
cwd_dir = sub_dir if os.path.exists(sub_dir) else os.getcwd()  

如果我們想在新的默認路徑下生成文件,保存分析結果。可以使用如下命令,其中+起到連接兩個字符串的作用。

plt.savefig(cwd_dir + "\\wordcloud_abstract_PeiQi.png", dpi=500, transparent=True)

如果覺得以上方法太過於麻煩,可以通過一下方法快速鎖定當前路徑。模塊就是程序,程序就是模塊。讓Python知道該模塊是作為程序運行,還是導入其他從程序中,這是可以運用 __name__ ,如果在主程序中運行 __name__ ,這是得到的是 __main__ , 如果在其他模塊中運行,返回模塊名字。

if __name__ = '__main__':
  pass # 占位符

文件導入速度比較:

我們常常需要將本地文件導入成DataFrame格式,因此會有csv, xlsx文件格式,但是那種文件導入速度更快那?

os

os、os.path 模塊中關於文件、目錄常用的函數使用方法

pandas csv 導入亂碼

報錯:UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb7 in position 158: invalid start byte

或許你可以這樣:

start_time = time.time()
df_train_por = pd.read_excel('./Data_xlsx/train.xlsx')
df_train_por = df_train_por.to_csv('./Data/train.csv', index=False)
print('數據讀取時間:', time.time() - start_time)

導入txt文件

%、format、f


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM