PHP改进计算字符串相似度的函数similar_text()、levenshtein()

一、介绍

一、介绍

PHP编程中,经常会涉及到比较两个字符串的相似程度,例如搜索引擎的关键词匹配,为此,PHP提供了两个用于计算字符串相似度的函数——similar_text()和levenshtein()。

  • similar_text()函数通过计算两个字符串相同字符的数量来确定它们之间的相似度百分比。
  • levenshtein()函数通过计算将一个字符串转换成另一个字符串所需的最少编辑距离(替换、插入、删除字符)来确定它们之间的相似度。

下面将分别介绍这两个函数的使用方法以及示例说明。

二、similar_text()函数

  1. 语法
int similar_text ( string $str1 , string $str2 [, float &$percent ] )
  1. 参数说明

  2. str1:第一个字符串。

  3. str2:第二个字符串。
  4. percent:相似度百分比,可选。

  5. 示例说明

下面是一个使用similar_text()函数计算字符串相似度的示例:

$str1 = "hello world";
$str2 = "HELLO WORLD";
similar_text($str1, $str2, $percent);
echo "字符串相似度为:".number_format($percent, 2)."%";

输出结果为:

字符串相似度为:81.82%

三、levenshtein()函数

  1. 语法
int levenshtein ( string $str1 , string $str2 [, int $cost_ins = 1 [, int $cost_rep = 1 [, int $cost_del = 1 ]]] )
  1. 参数说明

  2. str1:第一个字符串。

  3. str2:第二个字符串。
  4. cost_ins:插入操作的代价,默认为1。
  5. cost_rep:替换操作的代价,默认为1。
  6. cost_del:删除操作的代价,默认为1。

  7. 示例说明

下面是一个使用levenshtein()函数计算字符串相似度的示例:

$str1 = "hello world";
$str2 = "welcome";
$distance = levenshtein($str1, $str2);
echo "字符串距离为:".$distance;

输出结果为:

字符串距离为:11

四、总结

PHP提供了similar_text()和levenshtein()两个函数,用于计算字符串相似度。其中similar_text()计算两个字符串相同字符的数量来确定它们之间的相似度百分比,而levenshtein()计算将一个字符串转换成另一个字符串所需的最少编辑距离来确定它们之间的相似度。在实际编程中,要根据具体的需求选择使用哪个函数。

本文标题为:PHP改进计算字符串相似度的函数similar_text()、levenshtein()

基础教程推荐