Python Faker 教程展示了如何使用 Faker 软件包在 Python 中生成伪数据,我们使用joke2k/faker
库。
Faker 是一个生成伪造数据的 Python 库,Faka 数据通常用于测试或用一些伪数据填充数据库。 Faker 受 PHP 的 Faker,Perl 的 Data::Faker 和 Ruby 的 Faker 的启发。
设置 Faker
该软件包随 composer 一起安装。
$ pip install Faker
我们安装了 Faker 模块。
$ pip install Dumper
另外,我们安装了 Dumper,它在转储变量时提供更好的控制台输出。
Faker 生成器
faker.Faker()
创建并初始化一个伪造的生成器,该伪造器可以通过访问以数据类型命名的属性来生成数据。
Faker 将数据生成委托给提供者。 默认提供程序使用英语语言环境。 Faker 支持其他语言环境; 他们的完成水平不同。
简单的 Faker
以下示例是 Faker 的简单演示。
simple.py
#!/usr/bin/env python
from faker import Faker
faker = Faker()
print(f'name: {faker.name()}')
print(f'address: {faker.address()}')
print(f'text: {faker.text()}')
该示例输出假名称,地址和文本。
$ ./simple.py
name: Arthur Patton
address: 0638 Larsen Way
Tylermouth, CA 48344
text: Save general start bar. Become class both bank Mrs so myself.
Each difficult performance even. Total anyone develop her raise research both.
Laugh sport necessary tree. As during day up fall.
Faker 名称
在第二个示例中,我们伪造与用户名有关的数据。
names.py
#!/usr/bin/env python
from faker import Faker
faker = Faker()
print(f'Name: {faker.name()}')
print(f'First name: {faker.first_name()}')
print(f'Last name: {faker.last_name()}')
print('--------------------------')
print(f'Male name: {faker.name_male()}')
print(f'Female name: {faker.name_female()}')
该示例创建假的全名,男性的姓氏和姓氏。
$ ./names.py
Name: Tara Brown
First name: Stephanie
Last name: Martin
--------------------------
Male name: John Banks
Female name: Lacey Roberts
Faker 工作
作业由job()
生成。
jobs.py
#!/usr/bin/env python
from faker import Faker
faker = Faker()
for _ in range(6):
print(faker.job())
该示例创建了六个伪造作业。
$ ./jobs.py
Town planner
Paediatric nurse
Geographical information systems officer
Water quality scientist
Engineer, maintenance
Designer, ceramics/pottery
Faker 语言环境数据
Faker 在某种程度上支持本地化数据。 语言环境被传递给构造方法。 请注意,语言环境已完成各种级别。
localized.py
#!/usr/bin/env python
from faker import Faker
faker = Faker('cz_CZ')
for i in range(3):
name = faker.name()
address = faker.address()
phone = faker.phone_number()
print(f'{name}, {address}, {phone}')
该示例使用捷克语生成伪造数据。
$ ./localized.py
Irena Novotná, Nad Šancemi 725
055 80 Bojkovice, 606 136 053
Stanislav Svoboda, Březanova 225
621 17 Bystřice pod Hostýnem, 727 057 251
Klára Moravcová, Neužilova 6/3
134 97 Česká Kamenice, 606 374 469
请注意,捷克语具有口音。
Faker 货币
以下示例为货币创建伪造数据。
currencies.py
#!/usr/bin/env python
from faker import Faker
faker = Faker()
print(f'currency: {faker.currency()}')
print(f'currency name: {faker.currency_name()}')
print(f'currency code: {faker.currency_code()}')
该程序生成假货币。
$ ./currencies.py
currency: ('ISK', 'Icelandic króna')
currency name: Israeli new shekel
currency code: DJF
Faker 创建伪单词
Faker 允许创建假单词。
words.py
#!/usr/bin/env python
from faker import Faker
faker = Faker()
print(f'a word: {faker.word()}')
print(f'six words: {faker.words(6)}')
words = ['forest', 'blue', 'cloud', 'sky', 'wood', 'falcon']
print(f'customized unique words: {faker.words(3, words, True)}')
该示例创建伪单词。
print(f'a word: {faker.word()}')
该行生成一个伪造的单词。
print(f'six words: {faker.words(6)}')
在这里,我们生成六个伪单词。
words = ['forest', 'blue', 'cloud', 'sky', 'wood', 'falcon']
print(f'customized unique words: {faker.words(3, words, True)}')
我们还可以从预定义的单词列表中创建假单词。
$ words.py
a word: show
six words: ['value', 'its', 'those', 'wish', 'enter', 'hold']
customized unique words: ['forest', 'blue', 'sky']
Faker 个人数据
Faker 可以使用simple_profile()
创建简单的虚拟配置文件,并使用profile()
创建扩展的配置文件。
profiles.py
#!/usr/bin/env python
from faker import Faker
import dumper
faker = Faker()
profile1 = faker.simple_profile()
dumper.dump(profile1)
print('--------------------------')
profile2 = faker.simple_profile('M')
dumper.dump(profile2)
print('--------------------------')
profile3 = faker.profile(sex='F')
dumper.dump(profile3)
该示例为男性和女性创建虚拟概要文件。
$ ./profiles.py
<dict at 0x20d590a7678>:
username: 'gmorgan'
name: 'Jessica Clark'
sex: 'F'
address: '694 Joseph Valleys\nJohnfort, ME 81780'
mail: 'bettybuckley@yahoo.com'
birthdate: <str at 0x20d5bcbd7b0>: 'datetime.date(1938, 9, 18)'
--------------------------
<dict at 0x20d5b0065e8>:
username: 'mrios'
name: 'Harold Wagner'
sex: 'M'
address: '26439 Robinson Radial\nWest Meghanmouth, PA 85463'
mail: 'josechoi@gmail.com'
birthdate: <str at 0x20d5bcbd7b0>: 'datetime.date(1986, 8, 18)'
--------------------------
<dict at 0x20d5bd24990>:
job: 'Engineer, communications'
company: 'Jackson-Willis'
ssn: '430-41-6118'
residence: 'USNS Odom\nFPO AP 47095'
current_location: <tuple at 0x20d5bca9a88>
0: <str at 0x20d5bd248a0>: "Decimal('74.1885785')"
1: <str at 0x20d5bd248a0>: "Decimal('119.951995')"
blood_group: 'O-'
website: ['http://roberson.com/']
username: 'ygutierrez'
name: 'Lindsay Walker'
sex: 'F'
address: '22968 Beverly Road Suite 918\nTimothyborough, SD 10494'
mail: 'aliciamccall@yahoo.com'
birthdate: <str at 0x20d5bcbd7b0>: 'datetime.date(1979, 1, 4)'
Faker 号码
Faker 允许生成随机数字和整数。
fake_numbers.py
#!/usr/bin/env python
from faker import Faker
faker = Faker()
print(f'Random int: {faker.random_int()}')
print(f'Random int: {faker.random_int(0, 100)}')
print(f'Random digit: {faker.random_digit()}')
该示例生成随机数字和整数。
print(f'Random int: {faker.random_int(0, 100)}')
我们可以在random_int()
方法中指定界限。
$ ./fake_numbers.py
Random int: 5181
Random int: 91
Random digit: 9
Faker 哈希和 uuid
虚假哈希和 uuid 的 Faker 支持。
hash_uuid.py
#!/usr/bin/env python
from faker import Faker
faker = Faker()
print(f'md5: {faker.md5()}')
print(f'sha1: {faker.sha1()}')
print(f'sha256: {faker.sha256()}')
print(f'uuid4: {faker.uuid4()}')
该示例生成三个假哈希和一个 uuid 值。
$ ./hash_uuid.py
md5: aace57d56794686acec9eb190d401d46
sha1: 9f8f6af3089e7b5ed571591701afcfd9c2bb7a0e
sha256: 8b117b58599809f50735c701f598312b0f64203a8ffacde09af23db69cfd62d5
uuid4: 38092dcd-0e49-4ac0-b39b-7edf6db62290
Faker 互联网相关数据
Faker 有多个用于伪造与 Internet 相关的数据的访问器。
internet.py
#!/usr/bin/env python
from faker import Faker
faker = Faker()
print(f'Email: {faker.email()}')
print(f'Safe email: {faker.safe_email()}')
print(f'Free email: {faker.free_email()}')
print(f'Company email: {faker.company_email()}')
print('------------------------------------')
print(f'Host name: {faker.hostname()}')
print(f'Domain name: {faker.domain_name()}')
print(f'Domain word: {faker.domain_word()}')
print(f'TLD: {faker.tld()}')
print('------------------------------------')
print(f'IPv4: {faker.ipv4()}')
print(f'IPv6: {faker.ipv6()}')
print(f'MAC address: {faker.mac_address()}')
print('------------------------------------')
print(f'Slug: {faker.slug()}')
print(f'Image URL: {faker.image_url()}')
该示例显示了各种与 Internet 相关的数据,包括电子邮件,域名,信息,IP 地址和 URL。
$ ./internet.py
Email: hescobar@acevedo.info
Safe email: jonesgregory@example.net
Free email: zchambers@yahoo.com
Company email: paulbailey@gordon-woods.com
------------------------------------
Host name: desktop-12.rodriguez-underwood.com
Domain name: henry.com
Domain word: davis
TLD: com
------------------------------------
IPv4: 192.31.48.26
IPv6: 75cd:2c43:37f5:774c:dd:5a2f:ae5d:bfc9
MAC address: 3d:b1:39:ec:c6:53
------------------------------------
Slug: of-street-fight
Image URL: https://placeimg.com/311/871/any
Faker 日期和时间
Faker 有很多伪造日期和时间值的方法。
date_time.py
#!/usr/bin/env python
from faker import Faker
faker = Faker()
print(f'Date of birth: {faker.date_of_birth()}')
print(f'Century: {faker.century()}')
print(f'Year: {faker.year()}')
print(f'Month: {faker.month()}')
print(f'Month name: {faker.month_name()}')
print(f'Day of week: {faker.day_of_week()}')
print(f'Day of month: {faker.day_of_month()}')
print(f'Time zone: {faker.timezone()}')
print(f'AM/PM: {faker.am_pm()}')
第一个示例显示了伪造的生日,日期时间部分,时区和 AM / PM 方法。
$ date_time.py
Date of birth: 2008-08-07
Century: IV
Year: 1981
Month: 05
Month name: January
Day of week: Saturday
Day of month: 26
Time zone: Asia/Oral
AM/PM: AM
datetime2.py
#!/usr/bin/env python
from faker import Faker
faker = Faker()
print(f'Datetime this century: {faker.date_time_this_century()}')
print(f'Datetime this decade: {faker.date_time_this_decade()}')
print(f'Datetime this year: {faker.date_time_this_year()}')
print(f'Datetime this month: {faker.date_time_this_month()}')
print('-------------------------')
print(f'Date this century: {faker.date_this_century()}')
print(f'Date this decade: {faker.date_this_decade()}')
print(f'Date this year: {faker.date_this_year()}')
print(f'Date this month: {faker.date_this_month()}')
print('-------------------------')
TOTAL_SECONDS = 60*60*24*2 # two days
series = faker.time_series(start_date='-12d', end_date='now', precision=TOTAL_SECONDS)
for val in series:
print(val[0])
第二个示例显示了用于生成当前世纪,十年,年份或月份中的日期时间值的方法。 它还包括时间序列值的生成。
$ date_time2.py
Datetime this century: 2013-08-06 23:42:47
Datetime this decade: 2010-02-15 01:08:34
Datetime this year: 2019-03-10 05:32:42
Datetime this month: 2019-04-06 10:13:53
-------------------------
Date this century: 2014-11-04
Date this decade: 2018-03-07
Date this year: 2019-02-07
Date this month: 2019-04-04
-------------------------
2019-03-26 16:16:49
2019-03-28 16:16:49
2019-03-30 16:16:49
2019-04-01 16:16:49
2019-04-03 16:16:49
2019-04-05 16:16:49
datetime3.py
#!/usr/bin/env python
from faker import Faker
faker = Faker()
print(f'Unix time: {faker.unix_time()}')
print(f'Datetime: {faker.date_time()}')
print(f'iso8601: {faker.iso8601()}')
print(f'Date: {faker.date()}')
print(f'Time: {faker.time()}')
print('-------------------------')
print(f"Datetime between: {faker.date_time_between(start_date='-15y', end_date='now')}")
print(f"Date between: {faker.date_between()}")
print('-------------------------')
print(f"Future datetime: {faker.future_datetime()}")
print(f"Future date: {faker.future_date()}")
print(f"Past datetime: {faker.past_datetime()}")
print(f"Past date: {faker.past_date()}")
第三个示例显示了用于各种日期时间格式,获取选定范围的日期时间值以及生成未来或过去值的方法。
$ date_time3.py
Unix time: 1389138339
Datetime: 1988-01-24 09:16:09
iso8601: 2014-04-22T04:19:18
Date: 2009-05-01
Time: 12:07:51
-------------------------
Datetime between: 2011-03-18 21:00:23
Date between: 1992-07-09
-------------------------
Future datetime: 2019-04-11 13:36:02
Future date: 2019-04-14
Past datetime: 2019-03-21 12:27:20
Past date: 2019-03-22
Faker 生成 XML 数据
在以下示例中,我们使用 Faker 和 Jinja2 模板生成 XML 数据。 XML 文件将包含用户。
$ pip install jinja2
我们安装 Jinja2 模板引擎。
fake_xml.py
#!/usr/bin/env python3
from jinja2 import Environment, FileSystemLoader
from faker import Faker
class User:
def __init__(self, first_name, last_name, occupation):
self.first_name = first_name
self.last_name = last_name
self.occupation = occupation
faker = Faker()
users = []
for _ in range(10):
first_name = faker.first_name()
last_name = faker.last_name()
occupation = faker.job()
user = User(first_name, last_name, occupation)
users.append(user)
file_loader = FileSystemLoader('templates')
env = Environment(loader=file_loader)
template = env.get_template('users.xml.j2')
output = template.render(users=users)
print(output, file=open('users.xml', 'w'))
该程序将生成十个用户的列表。 该列表将传递到 Jinja2 模板进行处理。 模板位于templates
目录中。 生成的内容被写入users.xml
文件。
templates/users.xml.j2
<?xml version="1.0" encoding="UTF-8"?>
<users>
{% for user in users %}
<user id="{{ loop.index }}">
<firstname>{{ user.first_name }}</firstname>
<lastname>{{ user.last_name }}</lastname>
<occupation>{{ user.occupation }}</occupation>
</user>
{% endfor %}
</users>
在模板中,我们使用for
指令来处理用户列表。
在本教程中,我们使用 Python Faker 在 Python 中生成伪数据。
您可能也对以下相关教程感兴趣: Python Jinja 教程和 Python 教程。