//берем записи по порядку и пробегаем базу
$row_res = mysql_query("SELECT id, title FROM blog WHERE st = 0 ORDER by id");
while ($row = mysql_fetch_assoc($row_res)) {
$str = $row['title'];
//ставим в базу 2, означает - запись уже обработана
mysql_query("UPDATE blog SET st = 2 WHERE id = $row['id']");
//пробегам все записи и сверяем с взятой записью
$rows_res = mysql_query("SELECT id, title FROM blog WHERE st = 0 ORDER by id");
while ($rows = mysql_fetch_assoc($rows_res)) {
$sim = similar_text($row['title'], $rows['title'], $perc);
$sims = round($perc);
if($sims > 73) {mysql_query("DELETE FROM blog WHERE id = $rows['id']");}
}
}
но надо в запись добавлять 2 чтобы она больше никак не участвовала в скрипте
Пример использования similar_text() с заменой аргументов
В этом примере показано, что изменение порядка аргументов string1 и string2 может дать разные результаты.
$arr = [];
$result = $mysqli->query("SELECT `id`, `title` FROM `blog`");
while ($row = $result->fetch_assoc()) {
$arr[$row["id"]] = $row["title"];
}
$array = array();
$result = mysql_query("SELECT id, title FROM blogs");
while ($row = mysql_fetch_assoc($result)) {
$array[$row["id"]] = $row["title"];
}
$num = count($array);
for($i=0; $i < $num; $i++) {
for ($u = $i+1; $u < $num; $u++) {
if(isset($array[$i]) && isset($array[$u])) {
similar_text($array[$i], $array[$u], $prc);
if ($prc > 73) {mysql_query("DELETE FROM blogs WHERE id = {$array[$row["id"]]}");}
}
}
}
mysql_query("DELETE FROM blogs WHERE id = {$array[$row["id"]]}");
$num = count($array);
ini_set('error_reporting', E_ALL);
ini_set('display_errors', 1);
$array = array();
$result = mysql_query("SELECT `id`,`title` FROM `blogs`");
while ($row = mysql_fetch_assoc($result)) {
$array[] = array("id" => $row["id"], "title" => $row["title"]);
}
$num = count($array);
for($i = 0; $i < $num; $i++) {
for ($u = $i + 1; $u < $num; $u++) {
if (isset($array[$i]["title"], $array[$u]["title"])) {
similar_text($array[$i]["title"], $array[$u]["title"], $prc);
if ($prc > 73) {
mysql_query("DELETE FROM `blogs` WHERE `id`='{$array[$u]["id"]}'");
unset($array[$u]);
}
}
}
}
if ($prc > 73) {
echo "id = {$array[$i]["id"]}; title =
{$array[$i]["title"]}<br>";
echo "id = {$array[$u]["id"]}; title =
{$array[$u]["title"]}<br>";
unset($array[$u]);
}
Я бы пошёл по пути разборки записей на токены (слова)