Как в SQL сравнить строки не учитывая стоп-слова?

Question

Ernest Faizullin @erniesto77

oop, python, php, js

Как в SQL сравнить строки не учитывая стоп-слова?

Есть список стоп-слов, которые не нужно учитывать при сравнении предложений, пример:

'концерт'
'группа'
'группы'
'альбом'
'альбома'
'песни'
'презентация'

При сравнении названий концертов, нужно чтобы вот такие фразы можно было идентифицировать как один и тот же концерт:

'Группа ZebraHead'
'Песни группы ZebraHead'
'ZebraHead'
'Концерт группы ZebraHead'
'ZebraHead. Презентация альбома'

В таблице тысячи названий концертов и среди них есть похожие названия, которые нужно выявить и объединить присвоив этим строкам group_id (наименьший идентификатор в группе).
Пробовал функцию Левенштейна, но в таблице много строк и она работает очень медленно, а иногда просто зависает.

Вопрос задан более трёх лет назад
217 просмотров

Комментировать

Подписаться 1 Оценить Комментировать

Помогут разобраться в теме Все курсы

Нетология

Веб-разработчик с нуля: профессия с выбором специализации

14 месяцев

Далее
Яндекс Практикум

Фулстек-разработчик

16 месяцев

Далее
Skillbox

Веб-разработчик

16 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 1

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Веб-разработка

Простой
Можно ли в постмана подменить статус ответа например с 200 ок на 403?
- 1 подписчик
- 08 апр.
- 214 просмотров
2

ответа
JavaScript

+1 ещё

Простой
Как остаться на той же странице при скачивании файла?
- 1 подписчик
- 08 апр.
- 281 просмотр
2

ответа
Веб-разработка

Простой
Windows. БД и php — IIS или open-source?
- 1 подписчик
- 02 апр.
- 321 просмотр
2

ответа
Веб-разработка

+1 ещё

Простой
Мошеннический сайт. Как решить?
- 3 подписчика
- 26 мар.
- 727 просмотров
1

ответ
1С-Битрикс

+1 ещё

Простой
Как получить доступ к SQL-базе Bitrix 14.5?
- 2 подписчика
- 18 мар.
- 268 просмотров
2

ответа
Веб-разработка

Простой
Как оптимизировали сайт, что он летает?
- 2 подписчика
- 06 мар.
- 1179 просмотров
6

ответов
SQL

+2 ещё

Простой
Как ИИ использовать для написания sql запросов?
- 1 подписчик
- 02 мар.
- 803 просмотра
5

ответов
Веб-разработка

Простой
Как сделать полную копию сайта?
- 1 подписчик
- 14 февр.
- 687 просмотров
4

ответа
Веб-разработка

+1 ещё

Средний
Как на сайте с фильмами найти медиаплеер и скачать это видео через код?
- 1 подписчик
- 13 февр.
- 480 просмотров
2

ответа
Веб-разработка

+1 ещё

Простой
Как решаете проблему с отменой windows для shared hosting в РФ?
- 3 подписчика
- 11 февр.
- 1392 просмотра
0

ответов
Показать ещё Загружается…

Руководитель отдела продаж ( IT/сайты, Екатеринбург)

Neat-Studio • Екатеринбург

от 170 000 до 300 000 ₽

Специалист по парсингу сайтов

Qwintry

от 1 000 до 3 000 $

Fullstack разработчик (Laravel + Vue.js/React.js)

Nomadic Soft

от 1 600 до 2 240 $

Answer 1 · 2016-08-16 14:42:01

Может проще искать по общему ZebraHead?
`title` like '%ZebraHead%'

Если текст не длинный (только заголовки):
- создать таблицу со словами и соответствующему им id.
- выкинутть от туда стоп-слова путем пересечения таблиц.
- сделать подмены ошибок, транслитераций, вариаций.
- сгрупировать по словам.

Или воспользуйтесь опытом поисковых лингвистических анализаторов статья вам в помощь : https://habrahabr.ru/post/114997/
но быстро не будет.

P.S. Но я думаю, что нужно слегка поменять архитектуру.

Как в SQL сравнить строки не учитывая стоп-слова?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт