R语言 因子
因子是用于对数据进行分类和存储为级别的数据对象。它们可以存储字符串和整数。它们适用于具有有限数量独特值的列。例如,”男性”,”女性”和True,False等。它们在统计建模的数据分析中非常有用。
因子是通过使用 factor() 函数,以向量作为输入来创建的。
示例
执行上面的代码时,会产生以下结果−
数据框中的因子
创建带有文本数据列的数据框时,R将该文本列视为分类数据并在其上创建因子。
当我们执行上面的代码时,它产生以下结果 −
改变水平的顺序
通过再次应用
“`factor“`函数,并使用新的水平顺序,可以改变因子中水平的顺序。
当我们执行上述代码时,会产生以下结果 -。
生成因子水平
可以使用 gl() 函数来生成因子水平。它接受两个整数作为输入,表示有多少个水平和每个水平需要重复的次数。
语法
以下是参数的描述:
- n 是一个整数,表示级别的数量。
-
k 是一个整数,表示重复次数。
-
labels 是一个包含结果因子级别标签的向量。
示例
当我们执行上面的代码时,它会产生以下结果: