R语言 如何计算Levenshtein距离

R语言 如何计算Levenshtein距离

在这篇文章中,我们将讨论如何在R编程语言中计算列文施泰因距离。

两个字符串之间的 Levenshtein距离 是将一个字符串变成另一个字符串所需的最小字符替换、插入和删除的数量。Levenshtein距离实际上被用于近似的字符串匹配、拼写检查、自然语言处理等。

为了在R语言中计算Levenshtein距离,我们使用stringdist包库的stringdist()函数。stringdist包是一个R语言库,包含近似的字符串匹配、模糊文本搜索和字符串距离函数。stringdist()函数计算两个或多个字符串、向量或数据框列之间成对的字符串距离。

两个字符串之间的Levenshtein距离

要在R语言中计算Levenshtein距离,我们使用stringdist包库的stringdist()函数。stringdist()函数将两个字符串作为参数,并返回它们之间的列文斯坦距离。

语法: stringdist( string1, string2, method=”lv” )

参数

  • string1和string2: 确定要计算其列文斯坦距离的字符串。

例子: 这里,我们将计算两个字符串之间的列文斯坦距离。

# load library stringdist
library(stringdist)
  
# sample strings
string1= "Priyank"
string2= "geeksforgeeks"
  
# calculate Levenshtein Distance
stringdist(string1, string2, method = 'lv')

输出

如何在R语言中计算Levenshtein距离?

两个字符串向量之间的列文斯坦距离

为了计算R语言中两个向量之间的列文斯坦距离,我们使用stringdist包库的stringdist()函数。stringdist()函数将两个字符串向量作为参数,并返回一个包含其中每个字符串对之间列文斯坦距离的向量。

语法: stringdist( string_vec1, string_vec2, method=”lv” )

参数。

  • string_vec1和string_vec2: 决定要计算其列文斯坦距离的字符串向量。

例子: 这里,我们将计算两个字符串向量之间的列文斯坦距离。

# load library stringdist
library(stringdist)
  
# sample strings
string_vec1<- c("Priyank", "Abhiraj", "Sudhanshu")
string_vec2<- c("geeksforgeeks", "Devraj", "Pawan")
  
# calculate Levenshtein Distance
stringdist(string_vec1, string_vec2, method = 'lv')

输出

如何在R语言中计算Levenshtein距离?

数据框中两个字符串列之间的列文斯坦距离

为了在R语言中计算数据框架中两个字符串列之间的列文斯坦距离,我们使用stringdist包库的stringdist()函数。stringdist()函数将数据框中的两个字符串列作为参数,并返回一个包含它们之间列文斯坦距离的向量。

语法: stringdist( string_datacolumn1, string_datacolumn2, method=”lv” )

参数。

  • string_data: 决定了包含字符串列的数据框架。
  • column1和column2: 确定要计算列文斯坦距离的数据框架的字符串列。

例子: 在这里,我们将计算一个数据框架中两个字符串列之间的列文斯坦距离。

# load library stringdist
library(stringdist)
  
# sample string data frame
string_data<- data.frame(one= c("Priyank", 
                                "Abhiraj", "Sudhanshu"),
                         two= c("geeksforgeeks", 
                                "Devraj", "Pawan"))
  
# calculate Levenshtein Distance
string_datalevenshtein<-stringdist(string_dataone, 
                                    string_data$two,
                                    method = 'lv')
  
# print data frame
 string_data

输出

如何在R语言中计算Levenshtein距离?

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程