数据科学的Python数据类型

数据科学的Python数据类型

概述

Python是一种高级语言,用于许多目的,如开发网站和软件,数据可视化,数据分析和任务自动化。此外,它提供了使用科学、统计和数学功能的顶级技能。而且,它还为从事数据科学应用提供了极好的库。在应用领域方面,ML科学家也青睐Python

Python 中有许多数据类型。最流行的是list、dict(字典)、int(整数)、str(字符串)、bool(布尔)和float(浮点)。此外,还有许多用于数据科学的库,如NumPypandasMatplotlib、scipy等。

数据科学中的Python

数据科学的编程需要一种非常灵活的语言,既简单易学,又能进行极其复杂的数学运算。鉴于Python之前已经确立了自己作为通用和科学计算语言的地位,它最适合这种要求。此外,它还在不断改进,为其各种库添加新的内容,以适应不同的编程要求。

数据科学的Python数据类型

数据类型指的是数据组件的分类或分级。它代表着定义了对给定数据的可能操作的值的种类。

换句话说,数据类型是一类特定的数据项,可以通过它可以接受的值、可以用来创建它的编程语言或可以对它进行的操作来识别。

在Python中,我们已经讨论了内置的数据类型和它们的类别,在Python编程中,所有东西都是一个对象,因此数据类型是类,变量是该类的对象。

在Python中主要有五种标准的数据类型,它们如下所示

  • 数值–int、float、complex

  • 词典–dict

  • 布尔型 – bool

  • 设置 – 设置

  • 序列类型 – 列表、元组、范围

  • 字符串 – str

让我们逐一深入讨论。

Python数字数据类型

Python的数字数据类型是用来表示具有数字值的数据。它主要有三种类型,即属于int类的整数、属于float类的浮动数,甚至是属于complex类的复数。

整数 – 它里面有正数和负数的整数,没有分数和小数。并且属于int类,在Python中对整数的长度没有限制。

Float – 它有一个浮点表示,是一个实数。为了表示它,我们有一个小数点来表示它。我们可以在正数和负数后面加上e或E来指定科学符号。

复杂的号码 – 复数类作为复数的表示方法。作为一个例子,4+5j被描述为(实部)+(虚部)j。

注意 – 要识别数据的类型,请使用type()方法。

示例

numb1 = 2
print("Type of ", numb1, "is ", type(numb1))
numb2 = 1.0
print("Type of ", numb2, "is ", type(numb2))
numb3 = 2+3j
print("Type of ", numb3, "is ", type(numb3))

输出

('Type of ', 2, 'is ', <type 'int'>)
('Type of ', 1.0, 'is ', <type 'float'>)
('Type of ', (2+3j), 'is ', <type 'complex'>)

Python词典

Python 中的 dictionary 是一个无序的数据值集合,用于存储类似于 map 的数据值。字典由键值对组成,与其他数据类型相反,后者只能包含一个值。

为了提高字典的效率,包括了键值对。当表示字典数据类型时,每个键值对用冒号来区分,而每个键用 “逗号 “来区分。

词典的创建

在 Python 中,一个字典可以通过用大括号括住一些元素并用逗号隔开来制作。dictionary 中的值可以是任何数据类型,并且可以被复制,与键不同,键不能被重复,并且必须是不可改变的。一个 dictionary 是用内置函数 dict() 创建的。如果一个 dictionary 只是用大括号括起来,它将是空的。

示例

data = {'f_name': 'Prabhdeep', 'l_name': 'Singh', 'age': 25}
print(type(data))

输出

<type 'dict'>

上面的代码片段创建了一个名为data的字典,有三个键值对。

使用钥匙访问字典值

你可以使用这些键来访问字典中各自的值。

示例

data = {'f_name': 'Prabhdeep', 'l_name': 'Singh', 'age': 25}
# Access the value of first key - f_name
print(data['f_name'])
# Access the value of second key - l_name
print(data['l_name'])
# Access the value of last/ third key - age
print(data['age'])
# Access all values
print(data)

输出

Prabhdeep
Singh
25
{'l_name': 'Singh', 'f_name': 'Prabhdeep', 'age': 25}

注意 – 字典中的键是区分大小写的;也就是说,同一个名字可以根据键的大小写而有不同的含义。

Python布尔型

具有预定值True或False的数据。等于False的布尔对象是false(假),而等于True的布尔对象是truthy(真)。然而,在布尔语境下,也可以对非布尔事物进行评估和分类。bool类被用来表示它。

注意 – 布尔值必须以大写的T或F开头,才能被Python接受。Python 将对布尔值 true 和 false 抛出一个异常,因为它们是无效的。请看下面的例子

示例

# define a boolean variable
b = False
print(type(b))

输出

<type 'bool'>

Python集合数据类型

在 Python 中,一个集合是一个不重复的数据类型的集合,可以被迭代和改变。一个集合可以有多种成分,但各部分的位置并不固定。

无序的对象被分组为一个集合。任何集合元素都不能有任何重复,而且它必须是不可改变的(不能被改变)。

由于集合的无序性,索引将是无用的。因此,切分操作符[]也是无用的。

创建集

内置的set()方法可以用来建立具有可迭代对象或序列的集合,方法是将序列包裹在大括号后面,并用逗号、分隔它们。集合中的元素不一定是同一类型的,它们可能包含各种混合数据类型的值。

示例

# Create a set from a list using the set() function
s = set([1, 2, 3, 4, 5])
print(s) # Output: {1, 2, 3, 4, 5}
# Create a set using curly braces
s = {1, 2, 3, 4, 5}
print(s) # Output: {1, 2, 3, 4, 5}

输出

set([1, 2, 3, 4, 5])
set([1, 2, 3, 4, 5])

Python 序列

Python中的序列是相关或不相关的数据类型的有序分组。序列能够有序、有效地存储多个值。在Python中,有各种序列类型。它们在下面给出 –

  • List

  • Tuple

  • Range

列表数据类型

一个列表可以通过把所有的元素放在方括号里形成,所有现在的元素都用逗号隔开。元素可以是任何数据类型,甚至可以是一个列表,并且可以使用迭代器进行遍历,或者使用索引我们也可以获得元素。

示例

# Create a list using square brackets
l = [1, 2, 3, 4, 5]
print(l) # Output: [1, 2, 3, 4, 5]
# Access an item in the list using its index
print(l[1]) # Output: 2

输出

[1, 2, 3, 4, 5]
2

元组数据类型

图元与列表类似,但它们一旦被创建就不能被修改。图元通常用于存储不应该被修改的数据,如配置设置或从数据库中读取的数据。

下面是一个创建元组和访问其元素的例子

示例

# Create a tuple using parentheses
t = (1, 2, 3, 4)
print(t) # Output: (1, 2, 3, 4)
# Access an item in the tuple using its index
print(t[1]) # Output: 2

输出

(1, 2, 3, 4)
2

Python range

范围数据类型表示一个不可改变的数字序列。它类似于一个列表,但它的内存效率更高,迭代速度更快。

下面是Python中范围数据类型的一个例子

示例

# Create a range using the range() function
r = range(10)
print(r) # Output: range(0, 10)
# Access an item in the range using its index
print(r[3]) # Output: 3

输出

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
3

Python字符串

一串Unicode字符组成的字符串。字符串是由一个或多个字符组成的分组,用单引号、双引号或三引号括起来。可以用一个叫做 str 的类来表示它。在Python中没有字符数据类型,相反,一个字符是一个长度为1的字符串,类str用来表示它。

字符串可用于各种操作,包括串联、切片和重复。

  • 串联 – 这个过程涉及将两个或多个线程连接在一起。

  • 切片是一种将不同片断的绳子取出来的方法。

  • 重复一组指令,达到一定的次数就被称为重复。

结论

数据类型指的是数据组件的分类或分级。它是定义在给定数据集上可能操作的值的种类。在Python中,我们已经讨论了内置的数据类型和它们的类别,在Python编程中,所有的东西都是一个对象,因此数据类型是类,变量是该类的对象。在Python中主要有五种标准数据类型,它们是数字型、字典型、布尔型、集合型和序列型。

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程

Python 教程