一個python工程,以UDA為例一般有以下構成:
main.py作為工程的主文件或者部署服務的文件
uda.py 作為算法文件
preprocess.py進行預處理
utils文件夾存放一些工具腳本,比如格式轉化,分詞等,並且加一個文件__init__.py,使用的時候from utils import xxx
scripts文件夾,存放一些.sh腳本,用來下載數據、訓練等等
data或corpus文件夾,用來存放訓練數據
如果有額外的模塊,可以再建一個文件夾比如augmentation,加上__init__.py,專門用來進行數據增強