我們在開發中常常需要利用一些假數據來做測試,這種時候就可以使用 Faker
來偽造數據從而用來測試.
Faker 是一個可以讓你生成偽造數據的Python包。當你需要初始化數據庫,創建美觀的XML文檔,不斷產生數據來進行壓力測試或者想從生產服務器上拉取匿名數據的時候,Faker將是你最棒的選擇。
安裝
Faker庫已經被提交到 pip,可以通過 pip 工具直接安裝。
pip install Faker
官方文檔使用
faker 提供了一個工廠函數,用來創建數據。
>>> from faker import Factory >>> fake1 = Factory.create()
'Audrey Robinson'
'4266 Fritz Shore\nLewischester, AL 24594-7593'
'Odio porro unde sint aliquid beatae. Ex officiis porro nostrum laboriosam deleniti nisi. A aut molestiae ratione ipsam perspiciatis facere.\nDicta incidunt at deleniti recusandae accusamus quisquam.'
|
當然,也提供一個Faker類來創建實例
每次調用方法 fake.name()
都會產生不同的(隨機)結果。這是因為 faker 向 faker.Generator.method_name()
調用了 faker.Generator.format(method_name)
。
本地化
在用 Faker()
創建 faker 實例時,可以為實例指定本地化區域參數,默認為 ‘en_US`,因此生成的姓名、地址等都是美國的。
要生成中文偽造數據,只需:
>>> fake = Faker("zh_CN")
|
方法介紹
如上面例子,每次調用 fake 實例的 name()
方法時,都會產生不同隨機姓名。fake 實例還有很多方法可用,這些方法分為以下幾類:
- address 地址
- person 人物類:性別、姓名等
- barcode 條碼類
- color 顏色類
- company 公司類:公司名、公司email、公司名前綴等
- credit_card 銀行卡類:卡號、有效期、類型等
- currency 貨幣
- date_time 時間日期類:日期、年、月等
- file 文件類:文件名、文件類型、文件擴展名等
- internet 互聯網類
- job 工作
- lorem 亂數假文
- misc 雜項類
- phone_number 手機號碼類:手機號、運營商號段
- python python數據
- profile 人物描述信息:姓名、性別、地址、公司等
- ssn 社會安全碼(身份證號碼)
- user_agent 用戶代理
address 地址
'奧地利'
'鄭州市'
'市'
'河北省巢湖縣懷柔南寧路f座 169812'
'邯鄲路W座'
'合肥路'
'314548'
Decimal(
'68.0228435')
Decimal(
'155.964341')
|
person 人物
'單玉珍'
'潘'
'琴'
'官平'
'安'
'文'
'許穎'
|
barcode 條碼
'12771363'
'9133134950963'
'20417161'
|
color 顏色
'#671f6d'
'rgb(237,74,237)'
'208,102,218'
'Brown'
'#ee4400'
'maroon'
|
company 公司
'時空盒數字科技有限公司'
'科技有限公司'
|
credit_card 銀行信用卡
'375325478746231'
'VISA 13 digit'
'450'
'04/22'
'Maestro\n秀芳 商\n502001016117 04/27\nCVV: 144\n'
|
currency 貨幣
'HNL'
|
date_time 時間日期
datetime.datetime(
2001, 3, 18, 17, 57, 44)
'1973-11-16T22:58:37'
datetime.datetime(
2017, 11, 1, 14, 33, 48)
datetime.datetime(
2017, 3, 2, 13, 55, 31)
datetime.datetime(
2010, 3, 26, 6, 33, 23)
datetime.datetime(
2015, 7, 21, 19, 27, 53)
datetime.datetime(
2005, 12, 3, 17, 17, 15)
'America/Guatemala'
'11:21:52'
'PM'
'02'
'August'
'1974'
'Sunday'
'02'
datetime.timedelta(
13371, 27637)
datetime.date(
1983, 1, 26)
datetime.time(
17, 8, 56)
1223246848
'1984-04-20'
datetime.datetime(
341, 9, 11, 8, 6, 9)
|
file 文件
'增加.png'
'提供.pdf'
'txt'
'image/png'
|
internet 互聯網
'104.225.105.10'
'dea6:ca11:39d0:b49f:fff1:82f1:bf88:698b'
'search/categories'
'.htm'
'https://www.wei.com/terms/'
'http://zheng.org/'
'https://www.lorempixel.com/700/990'
'hu'
'hu.cn'
'com'
'xia13'
'Opera/8.33.(Windows NT 5.1; an-ES) Presto/2.9.171 Version/10.00'
'd6:38:cc:2a:76:b2'
'mingli@example.net'
'tao44@gmail.com'
'jingzhong@wang.cn'
'changjun@hao.com'
|
job 工作
'Dealer'
'Musician'
|
lorem 亂數假文
'語言無法應用為什一點國內.要求完成如何世界電腦發布作品.經濟不同教育個人科技全國.\n在線學生發布信息上海狀態.\n聯系一次通過其實介紹世界.增加也是使用成功那個.\n商品免費管理公司.留言自己這種內容.\n次數內容知道這樣女人感覺.操作他的生產出現如何報告文章只有.\n個人文化中心不能發布最新.質量一下提高.感覺最大工具表示最后計划.這是還有次數結果其實特別.'
'能力'
[
'國家', '經營', '結果']
'重要更多我們作品地方增加.'
[
'制作上海學生.', '方式汽車一樣技術幫助歡迎.', '說明一種深圳經營電話帖子.']
'非常環境位置有限發展首頁行業.情況對於出現部門這種覺得.產品以后因為雖然由於日本不同.'
[
'就是發布要求有關這里國際.美國設備深圳經營.首頁也是支持報告.', '決定可是只有發現開始一直.最后有些項目正在深圳關系決定.下載注冊圖片更多進行他的那些.', '必須他們發生數據准備聯系.同時這樣內容學校精華.']
|
misc 雜項
b'U\xa9@\x1e\x96\xe7\xca\x82\x14f'
'tg'
'cc4feebe419791332bbcff5e0fdf084a'
'8ac0e9980f880860b6e45ae6fd257cc847b7ae8d'
'033151f173f4a389e38e7df2363d89741f752c474e7bdfa2ee0a794bf0b505b5'
False
True
'F%722TJg_U'
'hy_AM'
'a50d17e7-bc4f-37a3-27b3-04a24fdd0055'
>>>
|
phone_number 電話號碼
'13334603608'
158
|
python python數據
7775
-84901.5586333
Decimal(
'-12273687068527.0')
'cblutNKFIyegfcHPrjzx'
True
[
'ODfeVvcbAjPDBGwzljQw', 'https://www.tan.cn/list/category/homepage.php', 'YQlrsFkBieyKYaXlCljJ', Decimal('42778240911787.2'), Decimal('957411812.6383'), 'TGbqZufoiUXLQTZDrVcP', 'http://yan.com/posts/tags/search/terms.php', 3.680492634254, 'min57@hotmail.com', datetime.datetime(2001, 8, 16, 6, 10, 49), 'xMMOjlETIgKGqVGTrChG', 'yong83@xu.cn']
[
'KXQMXAkcEMSLfnIZkgJb', 'BtowiRsuIqyyULnSYYdr', datetime.datetime(2011, 10, 10, 14, 44, 2), datetime.datetime(2008, 5, 10, 1, 38, 38), 'juan47@hotmail.com', 'QEsdUpEqHLpThyWCjkNx', Decimal('-801375867.9'), 'ucDyeZnHAXfZtkwdVUbR', 4707, datetime.datetime(1974, 8, 7, 1, 54, 29)]
{
'其中': 9047, '一直': 'AUiUjuqccIdVAWSqzDbW', '選擇': 'ddong@hotmail.com', '開發': datetime.datetime(1972, 10, 20, 14, 14, 9), '電影': 'KYmolBhkjSRxloXXFUUT', '文化': 2681, '這里': 'uyang@yahoo.com', '不會': 'ZPkwuxWsrJSHMNuFiWEx', '社會': 'CiujeaZMZSuyYwuKzEdN'}
{
'bhe@hotmail.com', 'http://fu.cn/list/home.htm', 'MlJluVirRkofBnKNtphM', 296, 'ghoUSHkuEGmCzlJFKyHZ', datetime.datetime(2008, 4, 4, 2, 55, 4), 'AgbynHjdvwYpUkbMsfqr', 8751, 9649, 'tangguiying@hotmail.com', Decimal('5727570036.91'), 'HmDkExndcQIOaTtsSpsc', 'hjQlLLXuHVVzENEwoHJK'}
(
'http://www.cai.com/index/', datetime.datetime(1973, 7, 28, 2, 12, 23), 'khltJQMYJvIDRMYodviZ', 'uJezUsEqiHaiFxwOPWvl', 'qojwZHyytBSQQavkDaTu', 'AHUCHYuVJTHnoSEuQDSY', 1012, 'uEYVuzeTlgVhrnCATfKw', 'https://www.zhou.com/categories/tags/main/', 'LbLSFZPeATtzHvbmYhGr')
([datetime.datetime(
1996, 10, 26, 7, 35, 26), datetime.datetime(1998, 2, 28, 17, 20, 8), 'qianming@hotmail.com', 'yEWMrpTqtAHfbxqldGrb', 'YgKYOnrjuthOrOXhlYIl', datetime.datetime(1994, 12, 10, 0, 55, 30), Decimal('-6865068.3'), 'SYHFHiFvJlRVPcCKumUM', -8619.4354, 'kwGipwcASeALLeKdaWBi'], {'同時': 'BvtYdkNTHwZNMiIIRwKd', '空間': 310959668662.457, '特別': 'PZQDBuuQWkcdryMloyKS', '音樂': Decimal('-7219015925.0'), '項目': 'https://www.zhou.cn/main.php', '回復': 30.408750841, '顯示': 'etZMrsjXJgZpDfZWhpoS', '大小': 7472, '類型': 'OsjpxgLqnTcdVOlHoMoP', '什么': 'http://www.xia.com/posts/app/index/'}, {'朋友': {0: -415025.243093017, 1: [1799, 585, 'shu@hotmail.com'], 2: {0: 9980, 1: 'qnOnFTzGnsjvXGybBnMF', 2: ['http://zheng.cn/list/search/tag/faq.html', Decimal('964285276661463.0')]}}, '發生': {1: -5339010.6134, 2: [datetime.datetime(1987, 6, 23, 15, 21, 45), 'SvSpvKqTXlJvdQhHScwM', 'PZjKOYzZzoNVsHLRcARQ'], 3: {1: 'https://www.yan.cn/register/', 2: 2191, 3: ['HMHKQuLRBQaaAypRbtHU', datetime.datetime(2014, 5, 24, 3, 32, 36)]}}, '我的': {2: 'linxia@yahoo.com', 3: ['http://gu.com/about.php', 'DhzpWYkgLCobGSHDLXzI', 1420], 4: {2: datetime.datetime(1986, 2, 22, 4, 50, 12), 3: 'rRHwQQzkpAMBQxwVITBa', 4: [datetime.datetime(1984, 2, 6, 11, 52, 18), -73821572962388.7]}}, '全部': {3: 'uMQeeBXYNGhrHnAerdjp', 4: [323329.56403, 'kFvqXFhhtQPNtrOjKtxa', 'http://peng.cn/'], 5: {3: 'lcaoeisYIAOsuRjbOXia', 4: Decimal('-902407032449085.0'), 5: [2296, 'uyuWgnsONzLluXqXdASM']}}, '大小': {4: 'min63@hotmail.com', 5: [datetime.datetime(1991, 10, 22, 19, 21, 48), 'cDYEScdIokWuvGhRkWqs', 'XeDJojWyywFvzmWYaokO'], 6: {4: Decimal('-4167029.2915827'), 5: 4030, 6: [6372, 'xfRXXEFGsNQpeIGmbaHU']}}, '語言': {5: 'https://www.guo.cn/', 6: [6498, datetime.datetime(1981, 12, 3, 18, 4, 29), 42598100345.61], 7: {5: 'http://zheng.cn/', 6: -229316.268238, 7: ['https://www.qiao.cn/home/', 'GtaEXeVxjRnnkggjEguv']}}, '表示': {6: 'xcBvcGUWxdMhDqgzmhSd', 7: ['kwDaFhyTKqHajGSaNOMf', 8561, 5456], 8: {6: 'https://zhou.cn/tags/tag/faq.html', 7: 'IGayAZtTQVlSOasQwgug', 8: ['iCjwBzHfmPSLqAgmIOle', 70511766106574.5]}}, '電子': {7: 'http://www.lu.org/tags/posts/terms/', 8: [datetime.datetime(1978, 8, 11, 12, 16, 35), 'https://song.cn/main/categories/homepage.html', 'https://long.com/register.html'], 9: {7: 'nFJNhyMYBvfTxrYwYPUQ', 8: -2252757903.0, 9: ['GuJnhMEgXoMAivrgGZie', datetime.datetime(2014, 5, 29, 1, 17, 50)]}}, '的人': {8: 'WgHePwYSPgSiPllXpLlJ', 9: [1782, 'fSepbXwpvhiBphzDTDNC', -9117731.63459416], 10: {8: 5602, 9: 3664, 10: ['http://www.mao.com/search/tag/main/', Decimal('5579.7377')]}}, '不過': {9: 'rOfkDPTHvzKbfvQHbPNm', 10: [314.397, 'StqeLyXkIDKHfExSjggk', 'xiuyingkang@gao.cn'], 11: {9: 'BLKNdcccamYzBwRcMxlx', 10: 'yongduan@gong.org', 11: ['ZocoQHdbhaNloWALnzwt', 'eWVvvHurAlZZRxlYHZXi']}}})
|
profile 人物描述信息
{
'job': 'Licensed conveyancer', 'company': '萬迅電腦信息有限公司', 'ssn': '370684199902182726', 'residence': '福建省小紅市南長廣州街K座 406448', 'current_location': (Decimal('18.050895'), Decimal('-0.877117')), 'blood_group': '0-', 'website': ['https://www.yi.org/', 'https://www.hu.com/', 'https://www.yin.cn/'], 'username': 'minghuang', 'name': '后英', 'sex': 'F', 'address': '安徽省秀榮市璧山嘉禾路T座 954960', 'mail': 'czhong@hotmail.com', 'birthdate': '1975-03-09'}
...
username chao85
name 邴宇
sex M
address 陝西省東市朝陽廖街Y座
757661
mail xiazhang@gmail.com
birthdate
1996-09-20
|
ssn 社會安全碼(身份證)
'140100196612297997'
18
|
user_agent 用戶代理
常用在偽造瀏覽器信息
'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/5361 (KHTML, like Gecko) Chrome/15.0.812.0 Safari/5361'
|
平台信息偽造
'X11; Linux i686'
'i686'
'Windows CE'
'Macintosh; Intel Mac OS X 10_7_4'
'PPC'
|
瀏覽器偽造
'Mozilla/5.0 (compatible; MSIE 5.0; Windows NT 6.1; Trident/4.0)'
'Opera/9.37.(Windows 95; doi-IN) Presto/2.9.178 Version/10.00'
'Mozilla/5.0 (Windows NT 5.0; te-IN; rv:1.9.2.20) Gecko/2015-09-28 13:29:05 Firefox/12.0'
'Mozilla/5.0 (Windows; U; Windows NT 4.0) AppleWebKit/533.37.4 (KHTML, like Gecko) Version/5.0 Safari/533.37.4'
'Mozilla/5.0 (Windows 98; Win 9x 4.90) AppleWebKit/5361 (KHTML, like Gecko) Chrome/14.0.866.0 Safari/5361'
|
自定義擴展
Faker 已經提供了足夠豐富的信息生成,包括名字、手機號、郵箱地址、郵編等等。盡管如此,可能還是沒有辦法滿足你的需求。這時,可以利用自定義擴展,引用外部的 provider,自定義你要的功能。
Faker 對象可以通過 add_provider
方法將自定義的 Provider 添加到對象中,自定義的 Provider 需要繼承自 BaseProvider。
from faker import Faker
fake = Faker()
# first, import a similar Provider or use the default one
from faker.providers import BaseProvider
# create new provider class
class MyProvider(BaseProvider):
def foo(self):
return 'bar'
# then add new provider to faker instance
fake.add_provider(MyProvider)
# now you can use:
print(fake.foo())
|
結果顯示:
bar
|
隨機控制
Faker
隨機生成由 random.Random
驅動。其中,.random
屬性返回 random.Random
對象。通過對該對象的操作,可以實現自定義的行為。
from faker import Faker
fake = Faker()
fake.random
fake.random.getstate()
|
那么,可以實現什么自定義呢?舉個例子,我們可以設置 seed
,通過給定的 seed
可以控制每次生成的內容都是一樣的。
'Ryan Gallagher'
'7631 Johnson Village Suite 690\nAdamsbury, NC 50008'
'Ryan Gallagher'
'7631 Johnson Village Suite 690\nAdamsbury, NC 50008'
|
不同的兩次運行,只要seed一樣,生成出來的信息就是一樣的。
注意:fake.random.seed(4321)
可以寫成 fake.seed(4321)
。
命令行生成
有時想在shell或者其他程序中生成一些偽數據,是不是一定要寫一個Python腳本呢?別急——Faker提供了一個命令行工具,估計可以應對大部分場景了:
$ faker address
968 Bahringer Garden Apt. 722Kristinaland, NJ 09890
$ python3 -m faker address
432 Marvin Wells Apt. 593\nWest Eric, DC 45650-8420
$ faker -l de_DE address
Samira-Niemeier-Allee 5694812 Biedenkopf
$ faker profile
{
'job': 'Designer, blown glass/stained glass', 'company': 'Dennis-Bowers', 'ssn': '034-28-9965', 'residence': '34796 Jeremiah Station Apt. 782\nWest Timothy, TX 24139-6974', 'current_location': (Decimal('-47.425017'), Decimal('-42.743615')), 'blood_group': '0+', 'website': ['https://www.gardner.biz/', 'http://glover-ellison.info/', 'http://www.harrison.biz/'], 'username': 'patrick33', 'name': 'Alexandra Montgomery', 'sex': 'F', 'address': '2314 Collier Stream Suite 093\nMcintyreside, UT 19553', 'mail': 'gomezterri@hotmail.com', 'birthdate': '2005-01-30'}
$ faker profile ssn,name
{
'ssn': '344-68-7420', 'name': 'Veronica Brennan'}
$ faker -r=3 -s=
";" name
Willam Kertzmann;
Josiah Maggio;
Gayla Schmitt;
|
faker 命令幫助:
faker [-h] [--version] [-o output]
[-l {bg_BG,cs_CZ,...,zh_CN,zh_TW}]
[-r REPEAT] [-s SEP]
[-i {module.containing.custom_provider othermodule.containing.custom_provider}]
[fake] [fake argument [fake argument ...]]
|
選項說明:
faker
: 在shell中,faker
命令也可以用python -m faker
來代替-h
,--help
: 幫助信息--version
:顯示版本-o FILENAM
:輸出結果到文件中-l {bg_BG,cs_CZ,...,zh_CN,zh_TW}
:指定本地化,zh_CN
表示中文-r REPEAT
:指定生成多少條相同類型的數據-s SEP
:在每個輸出后邊添加指定的分隔符-i {my.custom_provider other.custom_provider}
:自定義擴展,prividers
列表。注意,這里要指定包含你provider
類的模塊的路徑,而不是程序本身。fake
:指定方法名稱,如:name
,address
,text
等[fake argument ...]
:為方法指定參數。如上例,為profile
方法指定ssn
和name
參數,只輸出這兩個類型的內容。