R语言 如何计算Levenshtein距离
在这篇文章中,我们将讨论如何在R编程语言中计算列文施泰因距离。
两个字符串之间的 Levenshtein距离 是将一个字符串变成另一个字符串所需的最小字符替换、插入和删除的数量。Levenshtein距离实际上被用于近似的字符串匹配、拼写检查、自然语言处理等。
为了在R语言中计算Levenshtein距离,我们使用stringdist包库的stringdist()函数。stringdist包是一个R语言库,包含近似的字符串匹配、模糊文本搜索和字符串距离函数。stringdist()函数计算两个或多个字符串、向量或数据框列之间成对的字符串距离。
两个字符串之间的Levenshtein距离
要在R语言中计算Levenshtein距离,我们使用stringdist包库的stringdist()函数。stringdist()函数将两个字符串作为参数,并返回它们之间的列文斯坦距离。
语法: stringdist( string1, string2, method=”lv” )
参数 。
- string1和string2: 确定要计算其列文斯坦距离的字符串。
例子: 这里,我们将计算两个字符串之间的列文斯坦距离。
# load library stringdist
library(stringdist)
# sample strings
string1= "Priyank"
string2= "geeksforgeeks"
# calculate Levenshtein Distance
stringdist(string1, string2, method = 'lv')
输出 。
两个字符串向量之间的列文斯坦距离
为了计算R语言中两个向量之间的列文斯坦距离,我们使用stringdist包库的stringdist()函数。stringdist()函数将两个字符串向量作为参数,并返回一个包含其中每个字符串对之间列文斯坦距离的向量。
语法: stringdist( string_vec1, string_vec2, method=”lv” )
参数。
- string_vec1和string_vec2: 决定要计算其列文斯坦距离的字符串向量。
例子: 这里,我们将计算两个字符串向量之间的列文斯坦距离。
# load library stringdist
library(stringdist)
# sample strings
string_vec1<- c("Priyank", "Abhiraj", "Sudhanshu")
string_vec2<- c("geeksforgeeks", "Devraj", "Pawan")
# calculate Levenshtein Distance
stringdist(string_vec1, string_vec2, method = 'lv')
输出 。
数据框中两个字符串列之间的列文斯坦距离
为了在R语言中计算数据框架中两个字符串列之间的列文斯坦距离,我们使用stringdist包库的stringdist()函数。stringdist()函数将数据框中的两个字符串列作为参数,并返回一个包含它们之间列文斯坦距离的向量。
语法: stringdist( string_datacolumn1, string_datacolumn2, method=”lv” )
参数。
- string_data: 决定了包含字符串列的数据框架。
- column1和column2: 确定要计算列文斯坦距离的数据框架的字符串列。
例子: 在这里,我们将计算一个数据框架中两个字符串列之间的列文斯坦距离。
# load library stringdist
library(stringdist)
# sample string data frame
string_data<- data.frame(one= c("Priyank",
"Abhiraj", "Sudhanshu"),
two= c("geeksforgeeks",
"Devraj", "Pawan"))
# calculate Levenshtein Distance
string_datalevenshtein<-stringdist(string_dataone,
string_data$two,
method = 'lv')
# print data frame
string_data
输出 。