R语言 如何手动输入原始数据
在这篇文章中,我们将讨论如何在R编程语言中手动输入原始数据。
在R语言中,我们通过各种文件格式导入不同的数据集来处理大量的数据。但有时我们需要以字符向量、数据框或矩阵的形式输入自己的原始数据。在R语言中,有多种方法可以手动输入原始数据。
以矢量形式输入数据
要在R语言中以矢量形式输入数据,我们使用组合函数,即c()。c()函数是一个通用函数,它结合其参数形成一个矢量。所有参数都被强制为一个共同的类型。要创建一个数字向量,我们将数字作为参数传递给c()函数。要创建一个字符向量,我们将字符串或字符作为参数传给c()函数。
语法: sample_vector <- c( data1, data2, ….. , datan )
其中:data1, data2…: 决定构成向量的数字值。
例子: 演示基本的字符和数字向量。
# create numeric vector
numeric <- c(1,2,3,4,5)
# create character vector
character <- c("geeks", "for", "geeks")
# print vectors and their class
print("Character vector:")
character
print("Class:")
class(character)
print("Numeric vector:")
numeric
print("Class:")
class(numeric)
输出
Character vector:
"geeks" "for" "geeks"
Class:
"character"
Numeric vector:
1 2 3 4 5
Class:
"numeric"
以数据框的形式输入数据
要在R语言中把数据输入为数据框,我们要使用data.frame()函数。data.frame()函数创建的数据框架是紧密耦合的变量集合。这些数据框架作为R语言的基本数据结构被广泛使用。一个数据框架可以包含不同类别的向量,因此它成为一个满足所有需求的数据结构。
语法
data_frame <- data.frame( column_name1 = vector1, column_name2 = vector2 )
其中
- column_name1, column_name2: 决定了数据框架中的列的名称
- vector1, vector2: 决定了数据框架中列的数据值的数据向量。
例如: 基本数据框架包含一个数字向量和一个字符向量。
# create data frame
data_frame <- data.frame( id = c(1,2,3),
name = c("geeks", "for",
"geeks") )
# print dataframe, summary and its class
print("Data Frame:")
data_frame
print("Class:")
class(data_frame)
print("Summary:")
summary(data_frame)
输出
Data Frame:
id name
1 1 geeks
2 2 for
3 3 geeks
Class:
"data.frame"
Summary:
id name
Min. :1.0 Length:3
1st Qu.:1.5 Class :character
Median :2.0 Mode :character
Mean :2.0
3rd Qu.:2.5
Max. :3.0
以矩阵形式输入数据
要在R语言中以矩阵形式输入数据,我们要把矩阵的所有列创建为一个向量,然后使用列绑定函数即cbind()将它们合并成一个矩阵。cbind()函数是一个合并函数,它将两个具有相同行数的数据框或向量合并成一个数据框。
语法: mat <- cbind( col1, col2 )
其中,col1, col2: 决定要合并的列向量,以形成一个矩阵。
例子
这里,是一个用cbind()函数制作的R语言中的基本3X3矩阵。
# create 3 column vectors with 3
# rows each for a 3X3 matrix
col1 <- c(1,2,3)
col2 <- c(4,5,6)
col3 <- c(7,8,9)
# merge three column vectors into a matrix
mat <- cbind(col1, col2, col3)
# print matrix, its class and summary
print("Matrix:")
mat
print("Class:")
class(mat)
print("Summary:")
summary(mat)
输出
Matrix:
col1 col2 col3
[1,] 1 4 7
[2,] 2 5 8
[3,] 3 6 9
Class:
"matrix" "array"
Summary:
col1 col2 col3
Min. :1.0 Min. :4.0 Min. :7.0
1st Qu.:1.5 1st Qu.:4.5 1st Qu.:7.5
Median :2.0 Median :5.0 Median :8.0
Mean :2.0 Mean :5.0 Mean :8.0
3rd Qu.:2.5 3rd Qu.:5.5 3rd Qu.:8.5
Max. :3.0 Max. :6.0 Max. :9.0