R语言 的矩阵与数据框架
数据结构是在计算机中组织数据的一种特殊方式,以便能够有效地使用它。其目的是减少不同任务在空间和时间上的复杂性。
R中两个最重要的数据结构是Matrix和Dataframe,它们看起来一样,但性质不同。
R语言 的矩阵 –
它是一个同质的数据集集合,以二维的矩形组织排列。它是一个具有类似数据类型的m*n
数组。它是用一个矢量输入创建的。它有固定数量的行和列。你可以在R矩阵上进行许多算术运算,如:加法、减法、乘法和除法。
示例
# Matrix of two rows
# and three columns
# boolean value by row is true.
# passed as 4th parameter
A = matrix (c(11, 22, 33, 44, 55, 66),
nrow = 2, ncol = 3, byrow = 1)
# Printing Matrix
print(A)
输出
[, 1] [, 2] [, 3]
[1, ] 11 22 33
[2, ] 44 55 66
应用和使用
- 它在经济学上有很大的用途,可以计算一些数据,如GDP(国内生产毛额)或PI(人均收入价格)。
-
它在研究电气和电子电路方面也很有帮助。
-
矩阵用于调查研究,即绘制图表等。
-
在概率和统计中很有帮助。
R语言 的DataFrames –
它用于存储数据表格。它可以在称为字段的多列中包含多种数据类型。它是一个长度相等的向量列表。它是矩阵的一般化形式。它就像excel表中的表格。它有列和行的名字。行的名称是唯一的,没有空列。存储的数据必须是数字、字符或因子类型。数据框架是异质的。
例子
# creating company data frame
comp.data <- data.frame(
# company ids
# data members
comp_id = c (1:3),
# company names
comp_name = c("Geeks", "For", "Geeks"),
growth = c(16000, 14000, 12000),
# company start dates
# data members
comp_start_date = as.Date(c("02/05/10", "04/04/10", "05/03/10"))
)
print(comp.data)
输出:
应用和使用
-
数据框架可以做很多工作,如适合统计公式。
-
处理数据(矩阵不可能,首先必须转换为数据框架)。
-
可以进行转置,即把行改为列,反之亦然,这在数据科学中很有用。
矩阵和数据框架在R中的应用 矩阵 | 数据框架 |
---|---|
在一个二维的矩形组织中排列的数据集的集合。 | 存储数据表,在称为字段的多列中包含多种数据类型。 |
它是具有类似数据类型的m*n 数组。 |
它是一个等长的矢量列表。它是矩阵的一种普遍形式。 |
它有固定数量的行和列。 | 它的行和列的数量是可变的。 |
列中存储的数据只能是相同的数据类型。 | 存储的数据必须是数字、字符或因子类型。 |
矩阵是同质的。 | DataFrames是异质的。 |