Tidyverse简介
被称为Tidyverse的R包集合是以合作和有效处理数据为目标而创建的。Tidyverse包是开源的,并由数据科学社区不断改进。数据科学家必须对tidyverse伞下的每一个包有基本的了解。所有八个软件包–Purr, ggplot2, dplyr, tidyr, stringr, tibble, readr, and forcats–将被深入介绍。
Tidyverse套餐
包装名称 | 使用方法 |
---|---|
purrr | 用于功能编程 |
ggplot2 | 用于创建图形 |
dplyr | 用于数据操作 |
tidyr | 提供函数来创建整洁的数据 |
stringr | 提供处理字符数据的功能 |
tibble | 提供坚固的工作台系统 |
readr | 提供一个快速的方法来导入数据 |
f或者cats | 提供解决因子的常见问题的工具 |
安装Tidyverse
在进一步行动之前,我们需要在R中安装tidyverse包。你可以使用CRAN中的以下命令来安装这个包—
上面提到的所有tidyverse软件包都已安装。不需要单独安装这些软件包。
导入tidyverse
要将tidyverse导入到你的R脚本中,你可以使用library()函数,并将tidyverse包作为参数传入 —
读取Tidyverse中的数据
R中的 “readr “包允许我们在以read%和write%开头的函数的帮助下,从不同的文件格式中读取和写入文件。这些函数的工作速度非常快,并能顺利处理有问题的头文件名。
这些功能列举如下 –
Function | 工作 |
---|---|
read_csv() | 与分号或逗号一起使用 |
read_csv2() | 与分号或逗号一起使用 |
read_delim() | 与一般分离器一起工作 |
read_table() | 在含有数据的空白处工作 |
示例
让我们看一个例子,说明R中read_csv()函数的工作原理
输出
Tidyverse中的数据处理
dplyr软件包
dplyr包允许我们有效地处理表格数据。它为我们提供了一些动词函数,如select(),用于根据start_with()或contains()函数传递的一些条件提取特定列。
示例
请看下面的程序,它说明了这些函数的工作原理
输出
使用starts_with()函数只打印 “Ph “数据—。
输出
让我们打印所有包含 “雾 “的东西-
输出
正如你在输出中看到的,以 “Ph “开头并包含 “mist “的列名已经被提取出来。
summary()函数
这个函数产生一个数据集的摘要。
输出
summary()函数已经产生了虹膜模型的摘要。
filter()函数
这个函数用于挑选满足特定标准的数据。例如,考虑以下程序,它显示了数学分数在90和93之间的数据——。
示例
输出
arrange()函数
该函数用于在特定列的基础上排列数据集。例如,考虑以下程序,根据物理分数的排序显示数据集——。
示例
输出
重命名()函数
该函数用于重命名数据框架中的一个列。第一个参数对应的是新名称,等号后的第二个参数对应的是旧名称。例如,考虑下面的程序,将化学列重命名为CHEMISTRY –
示例
输出
Tidyverse中的数据可视化
ggplot2软件包
ggplot2包是一个专门用于数据可视化的开源包。这是由Hardley Wickham设计的一个强大的包。这个包为我们提供了各种功能。一个重要的函数是ggplot()。这个函数显示了一个数据集的可视化数据
示例
输出
正如你在输出中看到的,ggplot()函数已经绘制了它的可视化。
用purrr包进行函数编程
purrr包用于在R中实现函数式编程。 purrr包为我们提供了map_()系列函数,利用它我们可以实现函数式编程,获得与for和while循环相同的结果。
让我们来讨论其中的map()函数。这是最基本的函数。它接受一个向量和一个函数作为参数,然后为向量中的每个元素调用该函数。
示例
输出
正如你在上面的输出中所看到的,在给定向量的所有元素中加入3后,产生了一个列表。
用stringr包进行字符串操作
Stringr包用于在R中进行字符串操作,它提供以string%开头的函数。它最常用的函数是str_replace()和str_length()。str_replace()函数将一个模式或字符串替换成另一个字符串。让我们来看看下面的程序,它说明了str_replace()函数的工作原理
示例
输出
正如你在输出中看到的,包含 “point “的字符串已经被替换为 “Point”。
示例
让我们考虑另一个例子
输出
正如你在输出中看到的,以 “Bhuwanesh “开头的字符串被替换为 “Harshit”,以 “Nainwal “结束的字符串被替换为””。
str_length()函数用于用另一个字符串替换一个模式或字符串。
让我们看看下面的程序,它说明了str_length()函数的工作原理
示例
输出
结论
在本教程中,我们讨论了包的宇宙,即tidyverse。我们讨论了这些包如何工作,并对它们进行了说明。本教程肯定有助于你提高你在数据科学领域的知识。