R语言 如何计算多个变量之间的相关关系
在这篇文章中,我们将讨论如何在R编程语言中计算多个变量之间的相关关系。相关性是用来获得两个或多个变量之间的关系。
- 如果两个变量之间没有相关关系,结果为0。
- 如果两个变量之间存在正相关关系,结果为1。
- 如果两个变量之间存在负相关关系,则结果为-1。
让我们创建一个初始数据框架。
# create the dataframe with 4 columns
data=data.frame(col1=c(1:10),col2=c(11:20),
col3=c(21:30),col4=c(1:10))
# display
data
输出 。
col1 col2 col3 col4
1 1 11 21 1
2 2 12 22 2
3 3 13 23 3
4 4 14 24 4
5 5 15 25 5
6 6 16 26 6
7 7 17 27 7
8 8 18 28 8
9 9 19 29 9
10 10 20 30 10
方法1:两个变量之间的相关关系
在这种方法中,为了计算两个变量之间的相关性,用户必须简单地从基本的R语言中调用corr()函数,传入所需的参数,这些参数将是需要计算其相关性的变量的名称,而且这将在R编程语言中返回给定两个变量之间的相关细节。
语法:
cor(dataframecolumn1, dataframecolumn1)
其中。
- dataframe是输入的数据框架
- column1是与column2相关的column1
例子 。
在这个例子中,我们将创建一个有4列10行的数据框架,并使用R编程语言中的cor()函数找到col1和col2的相关性,col1和col3的相关性,col1和col4的相关性以及col3和col4的相关性。
# create the dataframe with 4 columns
data=data.frame(col1=c(1:10),col2=c(11:20),
col3=c(21:30),col4=c(1:10))
# correlation between col1 and col2
print(cor(datacol1,datacol2))
# correlation between col1 and col3
print(cor(datacol1,datacol3))
# correlation between col1 and col4
print(cor(datacol1,datacol4))
# correlation between col3 and col4
print(cor(datacol3,datacol4))
输出 。
1
1
1
1
方法2:多变量之间的相关关系
在这个方法中,用户必须调用cor()函数,然后在这个函数中,用户必须以向量的形式传递多个变量的名称作为其参数,通过在R编程语言中指定多个列名来获得多个变量之间的相关性。
语法:
cor(dataframe[, c('column1','column2',.,'column n')])
例子 。
在这个例子中,我们将在R编程语言中使用cor()函数找到col1,col3和col2,col1,col4和col2,以及col2,col3和col4之间的相关关系。
# create the dataframe with 4 columns
data=data.frame(col1=c(1:10),col2=c(11:20),
col3=c(21:30),
col4=c(1:5,34,56,32,23,45))
# correlation between col1,col3 and col2
print(cor(data[, c('col1','col3','col2')]))
# correlation between col1,col4 and col2
print(cor(data[, c('col1','col4','col2')]))
# correlation between col2,col3 and col4
print(cor(data[, c('col2','col3','col4')]))
输出 。
col1 col3 col2
col1 1 1 1
col3 1 1 1
col2 1 1 1
col1 col4 col2
col1 1.000000 0.787662 1.000000
col4 0.787662 1.000000 0.787662
col2 1.000000 0.787662 1.000000
col2 col3 col4
col2 1.000000 1.000000 0.787662
col3 1.000000 1.000000 0.787662
col4 0.787662 0.787662 1.000000
方法3:所有变量之间的相关性
在这种方法中,为了计算给定数据框中所有变量之间的相关性,用户需要调用cor()函数,将整个数据框作为其参数传递,以获得R编程语言中给定数据框中所有变量之间的相关性。
语法 。
cor(dataframe)
例子 。
在这个例子中,我们要在R编程语言中找到给定数据框架中所有列之间的相关性。
# create the dataframe with 4 columns
data=data.frame(col1=c(1:10),col2=c(11:20),
col3=c(21:30),
col4=c(1:5,34,56,32,23,45))
# correlation in entire dataframe
print(cor(data))
输出 。
col1 col2 col3 col4
col1 1.000000 1.000000 1.000000 0.787662
col2 1.000000 1.000000 1.000000 0.787662
col3 1.000000 1.000000 1.000000 0.787662
col4 0.787662 0.787662 0.787662 1.0000