Задать вопрос

Алекс Ли @alex-lin-coder

python

Python
CSV

Как разработать алгоритм который выберет для каждой организации базы Х из нескольких гипотез только одну наилучшую?

Здравствуйте.

Необходима ваша помощь. В каком направлении читать, изучать и пробовать.
Задача следующая:
Есть csv-файл с данными в котором собраны гипотезы о соответствии данных об организациях базы Х и данных об организациях из другого источника. В файле несколько столбцов (id, name, address, r_id, r_name, r_addrees). Приставка 'r_' это данные об организациях из другого источника.
Как я понимаю, необходимо использовать столбцы name и address. Id никак не влияет на результат.
Рассматриваю библиотеку "Fuzzy Wuzzy" для решения данной задачи или есть другие варианты?

UPD:
Задача решена. Как и предполагал, в этом мне помогла библиотека Fuzzy Wuzzy. Для более быстрой обработки используйте python-Levenshtein.
Подробное описание моего решения на моей странице .

Вопрос задан более трёх лет назад
232 просмотра

Комментировать

Подписаться 1 Оценить Комментировать

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Skillbox

Python-разработчик

10 месяцев

Далее
ProductStar

Профессия: Python-разработчик

8 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 1

dimonchik2013

Dimonchik @dimonchik2013

non progredi est regredi

https://habrahabr.ru/post/106207/ и сопутствующие статьи там же, их около 5-8 штук

Ответ написан более трёх лет назад

Комментировать

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

Простой
Существует ли менеджер виртуальных окружений для python, который хранит все пакеты в одном месте?
- 1 подписчик
- вчера
- 139 просмотров
1

ответ
Python

Простой
Почему не работает await event.message.delete()?
- 1 подписчик
- 16 дек.
- 207 просмотров
1

ответ
Python

Простой
Почему при установке iJulia у меня возникает ошибка, указывающая на отсутствие Conda?
- 1 подписчик
- 16 дек.
- 62 просмотра
0

ответов
Python

Простой
Почему выходит ошибка?
- 1 подписчик
- 15 дек.
- 180 просмотров
2

ответа
Python

+1 ещё

Средний
Разработка самообучающегося бота. Как лучше настроить экранное зрение?
- 2 подписчика
- 14 дек.
- 194 просмотра
1

ответ
Python

+2 ещё

Простой
Как получить доступ к элементам внутри shadow-root (closed)?
- 1 подписчик
- 09 дек.
- 134 просмотра
1

ответ
Python

+1 ещё

Простой
Как повысить читабельность кода?
- 1 подписчик
- 08 дек.
- 230 просмотров
0

ответов
Python

Простой
Как получить конкретный атрибут приложенный в обьект?
- 1 подписчик
- 28 нояб.
- 232 просмотра
1

ответ
Python

Простой
Как сохранить курсор в строке ввода при перезапуске explorer.exe?
- 1 подписчик
- 28 нояб.
- 154 просмотра
1

ответ
CSV

+1 ещё

Простой
Как перевести большие CSV файлы через ИИ?
- 1 подписчик
- 27 нояб.
- 138 просмотров
2

ответа
Показать ещё Загружается…

Специалист по API и автоматизации данных (Google Apps Script / Python)

Агентство ШОЛЬЧЕВ

До 100 000 ₽

Python Developer

Strikt

от 100 000 до 150 000 ₽

Python Software Engineer - ML/LLM

Ennabl • Лимассол

от 650 000 ₽