数据科学的Python数据类型
概述
Python是一种高级语言,用于许多目的,如开发网站和软件,数据可视化,数据分析和任务自动化。此外,它提供了使用科学、统计和数学功能的顶级技能。而且,它还为从事数据科学应用提供了极好的库。在应用领域方面,ML科学家也青睐Python。
在 Python 中有许多数据类型。最流行的是list、dict(字典)、int(整数)、str(字符串)、bool(布尔)和float(浮点)。此外,还有许多用于数据科学的库,如NumPy、pandas、Matplotlib、scipy等。
数据科学中的Python
数据科学的编程需要一种非常灵活的语言,既简单易学,又能进行极其复杂的数学运算。鉴于Python之前已经确立了自己作为通用和科学计算语言的地位,它最适合这种要求。此外,它还在不断改进,为其各种库添加新的内容,以适应不同的编程要求。
数据科学的Python数据类型
数据类型指的是数据组件的分类或分级。它代表着定义了对给定数据的可能操作的值的种类。
换句话说,数据类型是一类特定的数据项,可以通过它可以接受的值、可以用来创建它的编程语言或可以对它进行的操作来识别。
在Python中,我们已经讨论了内置的数据类型和它们的类别,在Python编程中,所有东西都是一个对象,因此数据类型是类,变量是该类的对象。
在Python中主要有五种标准的数据类型,它们如下所示
- 数值–int、float、complex
-
词典–dict
-
布尔型 – bool
-
设置 – 设置
-
序列类型 – 列表、元组、范围
-
字符串 – str
让我们逐一深入讨论。
Python数字数据类型
Python的数字数据类型是用来表示具有数字值的数据。它主要有三种类型,即属于int类的整数、属于float类的浮动数,甚至是属于complex类的复数。
整数 – 它里面有正数和负数的整数,没有分数和小数。并且属于int类,在Python中对整数的长度没有限制。
Float – 它有一个浮点表示,是一个实数。为了表示它,我们有一个小数点来表示它。我们可以在正数和负数后面加上e或E来指定科学符号。
复杂的号码 – 复数类作为复数的表示方法。作为一个例子,4+5j被描述为(实部)+(虚部)j。
注意 – 要识别数据的类型,请使用type()方法。
示例
numb1 = 2
print("Type of ", numb1, "is ", type(numb1))
numb2 = 1.0
print("Type of ", numb2, "is ", type(numb2))
numb3 = 2+3j
print("Type of ", numb3, "is ", type(numb3))
输出
('Type of ', 2, 'is ', <type 'int'>)
('Type of ', 1.0, 'is ', <type 'float'>)
('Type of ', (2+3j), 'is ', <type 'complex'>)
Python词典
Python 中的 dictionary 是一个无序的数据值集合,用于存储类似于 map 的数据值。字典由键值对组成,与其他数据类型相反,后者只能包含一个值。
为了提高字典的效率,包括了键值对。当表示字典数据类型时,每个键值对用冒号来区分,而每个键用 “逗号 “来区分。
词典的创建
在 Python 中,一个字典可以通过用大括号括住一些元素并用逗号隔开来制作。dictionary 中的值可以是任何数据类型,并且可以被复制,与键不同,键不能被重复,并且必须是不可改变的。一个 dictionary 是用内置函数 dict() 创建的。如果一个 dictionary 只是用大括号括起来,它将是空的。
示例
data = {'f_name': 'Prabhdeep', 'l_name': 'Singh', 'age': 25}
print(type(data))
输出
<type 'dict'>
上面的代码片段创建了一个名为data的字典,有三个键值对。
使用钥匙访问字典值
你可以使用这些键来访问字典中各自的值。
示例
data = {'f_name': 'Prabhdeep', 'l_name': 'Singh', 'age': 25}
# Access the value of first key - f_name
print(data['f_name'])
# Access the value of second key - l_name
print(data['l_name'])
# Access the value of last/ third key - age
print(data['age'])
# Access all values
print(data)
输出
Prabhdeep
Singh
25
{'l_name': 'Singh', 'f_name': 'Prabhdeep', 'age': 25}
注意 – 字典中的键是区分大小写的;也就是说,同一个名字可以根据键的大小写而有不同的含义。
Python布尔型
具有预定值True或False的数据。等于False的布尔对象是false(假),而等于True的布尔对象是truthy(真)。然而,在布尔语境下,也可以对非布尔事物进行评估和分类。bool类被用来表示它。
注意 – 布尔值必须以大写的T或F开头,才能被Python接受。Python 将对布尔值 true 和 false 抛出一个异常,因为它们是无效的。请看下面的例子
示例
# define a boolean variable
b = False
print(type(b))
输出
<type 'bool'>
Python集合数据类型
在 Python 中,一个集合是一个不重复的数据类型的集合,可以被迭代和改变。一个集合可以有多种成分,但各部分的位置并不固定。
无序的对象被分组为一个集合。任何集合元素都不能有任何重复,而且它必须是不可改变的(不能被改变)。
由于集合的无序性,索引将是无用的。因此,切分操作符[]也是无用的。
创建集
内置的set()方法可以用来建立具有可迭代对象或序列的集合,方法是将序列包裹在大括号后面,并用逗号、分隔它们。集合中的元素不一定是同一类型的,它们可能包含各种混合数据类型的值。
示例
# Create a set from a list using the set() function
s = set([1, 2, 3, 4, 5])
print(s) # Output: {1, 2, 3, 4, 5}
# Create a set using curly braces
s = {1, 2, 3, 4, 5}
print(s) # Output: {1, 2, 3, 4, 5}
输出
set([1, 2, 3, 4, 5])
set([1, 2, 3, 4, 5])
Python 序列
Python中的序列是相关或不相关的数据类型的有序分组。序列能够有序、有效地存储多个值。在Python中,有各种序列类型。它们在下面给出 –
- List
-
Tuple
-
Range
列表数据类型
一个列表可以通过把所有的元素放在方括号里形成,所有现在的元素都用逗号隔开。元素可以是任何数据类型,甚至可以是一个列表,并且可以使用迭代器进行遍历,或者使用索引我们也可以获得元素。
示例
# Create a list using square brackets
l = [1, 2, 3, 4, 5]
print(l) # Output: [1, 2, 3, 4, 5]
# Access an item in the list using its index
print(l[1]) # Output: 2
输出
[1, 2, 3, 4, 5]
2
元组数据类型
图元与列表类似,但它们一旦被创建就不能被修改。图元通常用于存储不应该被修改的数据,如配置设置或从数据库中读取的数据。
下面是一个创建元组和访问其元素的例子
示例
# Create a tuple using parentheses
t = (1, 2, 3, 4)
print(t) # Output: (1, 2, 3, 4)
# Access an item in the tuple using its index
print(t[1]) # Output: 2
输出
(1, 2, 3, 4)
2
Python range
范围数据类型表示一个不可改变的数字序列。它类似于一个列表,但它的内存效率更高,迭代速度更快。
下面是Python中范围数据类型的一个例子
示例
# Create a range using the range() function
r = range(10)
print(r) # Output: range(0, 10)
# Access an item in the range using its index
print(r[3]) # Output: 3
输出
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
3
Python字符串
一串Unicode字符组成的字符串。字符串是由一个或多个字符组成的分组,用单引号、双引号或三引号括起来。可以用一个叫做 str 的类来表示它。在Python中没有字符数据类型,相反,一个字符是一个长度为1的字符串,类str用来表示它。
字符串可用于各种操作,包括串联、切片和重复。
- 串联 – 这个过程涉及将两个或多个线程连接在一起。
-
切片是一种将不同片断的绳子取出来的方法。
-
重复一组指令,达到一定的次数就被称为重复。
结论
数据类型指的是数据组件的分类或分级。它是定义在给定数据集上可能操作的值的种类。在Python中,我们已经讨论了内置的数据类型和它们的类别,在Python编程中,所有的东西都是一个对象,因此数据类型是类,变量是该类的对象。在Python中主要有五种标准数据类型,它们是数字型、字典型、布尔型、集合型和序列型。