三種常用的方式
如果在運行python腳本時需要傳入一些參數,例如gpus與batch_size,可以使用如下三種方式。
這三種格式對應不同的參數解析方式,分別為sys.argv, argparse, tf.app.run, 前兩者是python自帶的功能,后者是tensorflow提供的便捷方式。
sys.argv
sys模塊是很常用的模塊, 它封裝了與python解釋器相關的數據,例如sys.modules里面有已經加載了的所有模塊信息,sys.path里面是PYTHONPATH的內容,而sys.argv則封裝了傳入的參數數據。
使用sys.argv接收上面第一個命令中包含的參數方式如下:
argparse
需要注意的是,腳本運行命令python script.py -gpus=0,1,2 --batch-size=10中的--batch-size會被自動解析成batch_size.parser.add_argument 方法的type參數理論上可以是任何合法的類型, 但有些參數傳入格式比較麻煩,例如list,所以一般使用bool, int, str, float這些基本類型就行了,更復雜的需求可以通過str傳入,然后手動解析。bool類型的解析比較特殊,傳入任何值都會被解析成True,傳入空值時才為False
通過這個方法還能指定命令的幫助信息。具體請看API文檔:https://docs.python.org/2/library/argparse.html
tf.app.run
tensorflow也提供了一種方便的解析方式。
腳本的執行命令為:
python script.py -gpus=0,1,2 --batch_size=10
對應的python代碼為:
幾點需要注意:
tensorflow只提供以下幾種方法:tf.app.flags.DEFINE_string,tf.app.flags.DEFINE_integer,tf.app.flags.DEFINE_boolean,tf.app.flags.DEFINE_float四種方法,分別對應str,int,bool,float類型的參數。這里對bool的解析比較嚴格,傳入1會被解析成True,其余任何值都會被解析成False。- 腳本中需要定義一個接收一個參數的
main方法:def main(_):,這個傳入的參數是腳本名,一般用不到, 所以用下划線接收。 - 以
batch_size參數為例,傳入這個參數時使用的名稱為--batch_size,也就是說,中划線不會像在argparse中一樣被解析成下划線。 tf.app.run()會尋找並執行入口腳本的main方法。也只有在執行了tf.app.run()之后才能從FLAGS中取出參數。
從它的簽名來看,它也是可以自己指定需要執行的方法的,不一定非得叫main:
5 . tf.app.flags只是對argpars的簡單封裝。代碼見
https://github.com/tensorflow/tensorflow/blob/r1.2/tensorflow/python/platform/flags.py
