三種常用的方式
如果在運行python腳本時需要傳入一些參數,例如gpus
與batch_size
,可以使用如下三種方式。
這三種格式對應不同的參數解析方式,分別為sys.argv
, argparse
, tf.app.run
, 前兩者是python自帶的功能,后者是tensorflow
提供的便捷方式。
sys.argv
sys
模塊是很常用的模塊, 它封裝了與python解釋器相關的數據,例如sys.modules
里面有已經加載了的所有模塊信息,sys.path
里面是PYTHONPATH
的內容,而sys.argv
則封裝了傳入的參數數據。
使用sys.argv
接收上面第一個命令中包含的參數方式如下:
argparse
需要注意的是,腳本運行命令python script.py -gpus=0,1,2 --batch-size=10
中的--batch-size
會被自動解析成batch_size
.parser.add_argument
方法的type
參數理論上可以是任何合法的類型, 但有些參數傳入格式比較麻煩,例如list,所以一般使用bool
, int
, str
, float
這些基本類型就行了,更復雜的需求可以通過str
傳入,然后手動解析。bool
類型的解析比較特殊,傳入任何值都會被解析成True
,傳入空值時才為False
通過這個方法還能指定命令的幫助信息。具體請看API文檔:https://docs.python.org/2/library/argparse.html
tf.app.run
tensorflow也提供了一種方便的解析方式。
腳本的執行命令為:
python script.py -gpus=0,1,2 --batch_size=10
對應的python代碼為:
幾點需要注意:
tensorflow
只提供以下幾種方法:tf.app.flags.DEFINE_string
,tf.app.flags.DEFINE_integer
,tf.app.flags.DEFINE_boolean
,tf.app.flags.DEFINE_float
四種方法,分別對應str
,int
,bool
,float
類型的參數。這里對bool
的解析比較嚴格,傳入1會被解析成True
,其余任何值都會被解析成False
。- 腳本中需要定義一個接收一個參數的
main
方法:def main(_):
,這個傳入的參數是腳本名,一般用不到, 所以用下划線接收。 - 以
batch_size
參數為例,傳入這個參數時使用的名稱為--batch_size
,也就是說,中划線不會像在argparse
中一樣被解析成下划線。 tf.app.run()
會尋找並執行入口腳本的main
方法。也只有在執行了tf.app.run()
之后才能從FLAGS
中取出參數。
從它的簽名來看,它也是可以自己指定需要執行的方法的,不一定非得叫main
:
5 . tf.app.flags
只是對argpars
的簡單封裝。代碼見
https://github.com/tensorflow/tensorflow/blob/r1.2/tensorflow/python/platform/flags.py