如果在運行python腳本時需要傳入一些參數,例如gpus
與batch_size
,可以使用如下三種方式。
python script.py 0,1,2 10 python script.py -gpus=0,1,2 --batch-size=10 python script.py -gpus=0,1,2 --batch_size=10
這三種格式對應不同的參數解析方式,分別為sys.argv
、argparse、
tf.app.run,
前兩者是python自帶的功能,后者是tensorflow
提供的便捷方式。
1.sys.argv
sys
模塊是很常用的模塊, 它封裝了與python解釋器相關的數據,例如
sys.modules
里面有已經加載了的所有模塊信息,
sys.path
里面是
PYTHONPATH
的內容,而
sys.argv
則封裝了傳入的參數數據。
使用
sys.argv
接收上面第一個命令中包含的參數方式如下:
import sys gpus = sys.argv[1] #gpus = [int(gpus.split(','))] batch_size = sys.argv[2] print(gpus) print(batch_size)
2.argparse
import argparse parser = argparse.ArgumentParser(description='manual to this script') parser.add_argument("--gpus", type=str, default="0") parser.add_argument("--batch-size", type=int, default=32) args = parser.parse_args() print(args.gpus) print(args.batch_size)
需要注意的是,腳本運行命令
python script.py -gpus=0,1,2 --batch-size=10
中的
--batch-size
會被自動解析成
batch_size
.
parser.add_argument
方法的
type
參數理論上可以是任何合法的類型, 但有些參數傳入格式比較麻煩,例如list,所以一般使用
bool
,
int
,
str
,
float
這些基本類型就行了,更復雜的需求可以通過
str
傳入,然后手動解析。
bool
類型的解析比較特殊,傳入任何值都會被解析成
True
,傳入空值時才為
False
3.tf.app.run
import tensorflow as tf tf.app.flags.DEFINE_string('gpus', None, 'gpus to use') tf.app.flags.DEFINE_integer('batch_size', 5, 'batch size') FLAGS = tf.app.flags.FLAGS def main(_): print(FLAGS.gpus) print(FLAGS.batch_size) if __name__=="__main__": tf.app.run()
有幾點需要注意:
tensorflow
只提供以下幾種方法:
tf.app.flags.DEFINE_string
,
tf.app.flags.DEFINE_integer
,
tf.app.flags.DEFINE_boolean
,
tf.app.flags.DEFINE_float
四種方法,分別對應str
, int
,bool
,float
類型的參數。這里對bool
的解析比較嚴格,傳入1會被解析成True
,其余任何值都會被解析成False
。
腳本中需要定義一個接收一個參數的main
方法:def main(_):
,這個傳入的參數是腳本名,一般用不到, 所以用下划線接收。
以batch_size
參數為例,傳入這個參數時使用的名稱為--batch_size
,也就是說,中划線不會像在argparse
中一樣被解析成下划線。
tf.app.run()
會尋找並執行入口腳本的main
方法。也只有在執行了tf.app.run()
之后才能從FLAGS
中取出參數。
從它的簽名來看,它也是可以自己指定需要執行的方法的,不一定非得叫main
: