Как оптимизировать код на Python (поиск в строке)?

Question

Станислав Фатеев @svfat

☺Нужен VPS? Два месяца бесплатно. Смотри профиль☺

Python

Как оптимизировать код на Python (поиск в строке)?

Есть такой код - ищет последовательность символов в строке, и возвращает True, если последовательность найдена:

if word in s:
    return True
else:
    return False

Очень просто и наглядно. Проблема в том, что этот участок вызывается программой несколько миллионов раз, и скорость его работы критична. Как можно это ускорить?

UPDATE:
Количество различных s не определено, количество различных word около 1000

Вопрос задан более трёх лет назад
3204 просмотра

Комментировать

Подписаться 5 Оценить Комментировать

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Решения вопроса 1

3 комментария

Пригласить эксперта

Ответы на вопрос 4

Комментировать

4 комментария

Станислав Фатеев @svfat Автор вопроса

Что-то я не могу понять, как это будет работать для неопределенного количества различных s

Написано более трёх лет назад
Ivan Velichko @iximiuz

Станислав Фатеев: Упс, я исходил из предположения, что s одна и та же. Тогда можно индекс сделать двойной вложенности, сначала по s, затем по word или наоборот. В зависимости от частотности. Плюс можно делать md5(s) в качестве ключа индекса, чтобы не хранить строку целиком.

Написано более трёх лет назад
Станислав Фатеев @svfat Автор вопроса

Иван Величко: уточнил условие

Написано более трёх лет назад
Ivan Velichko @iximiuz

Pavel Denisov: Временная сложность поиска и добавления элемента в set и dict одинаковая. По поводу тестов - согласен. Правда в свете обновленных условий вопроса - количество различных s не определено, я бы стал смотреть уже вот в этом направлении https://toster.ru/answer?answer_id=528145.

Написано более трёх лет назад

Комментировать

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+3 ещё

Простой
Авто торговля на байбите?
- 1 подписчик
- 15 мая
- 309 просмотров
1

ответ
Python

Простой
Как научиться извлекать математическую модель для решения задач на программирование?
- 1 подписчик
- 14 мая
- 216 просмотров
2

ответа
Python

+3 ещё

Средний
Как перенести позу SMPL модели на игровую 3д модель?
- 2 подписчика
- 10 мая
- 283 просмотра
1

ответ
Python

+1 ещё

Простой
Как при вызове хранимой процедуры получать значения RAISE NOTICE?
- 2 подписчика
- 13 апр.
- 279 просмотров
2

ответа
Python

+2 ещё

Простой
Почему не работает Selenium?
- 1 подписчик
- 09 апр.
- 311 просмотров
2

ответа
Python

Простой
В чем ошибка в использовании ft.ResponsiveView в данном коде?
- 1 подписчик
- 08 апр.
- 103 просмотра
1

ответ
Python

Простой
Можно ли указывать во flet heigh и width через проценты?
- 1 подписчик
- 02 апр.
- 118 просмотров
1

ответ
Python

Простой
Как правильно позиционировать элементы во flet?
- 1 подписчик
- 02 апр.
- 108 просмотров
1

ответ
Python

Простой
Почему может не отображаться страница во view(flet)?
- 1 подписчик
- 25 мар.
- 128 просмотров
1

ответ
Python

Средний
Asyncio + PySide6 + Telethon: список чатов и треды грузятся 30 минут — где искать причину?
- 2 подписчика
- 16 мар.
- 487 просмотров
2

ответа
Показать ещё Загружается…

Answer 1 · 2015-02-25 11:34:36

Andrey K @mututunus

Backend developer (Python, Golang)

Реализуйте более быстрый алгоритм. Можно на си, если хотите еще быстрее.
https://ru.wikipedia.org/wiki/%D0%9F%D0%BE%D0%B8%D...

Ответ написан более трёх лет назад

3 комментария

Answer 2 · 2015-02-25 12:45:50

Проверка word in s сама по себе довольно оптимальная. Если вам надо оптимизировать алгоритм для поиска многих подстрок одновременно - то взгляните на алгоритм Ахо-Корасик

Answer 3 · 2015-02-25 11:37:51

Если количество уникальных word не слишком велико, то можно сделать "index" по ним. Тогда последующий поиск такой же подстроки будет происходить за O(1), а не за O(n) как это происходит с оператором in. Минус - оверхед по памяти на индекс.

def in_checker(word, s):
    if not hasattr(in_checker, '_index'):
        in_checker._index = {}
    if word not in in_checker._index:
        in_checker._index[word] = word in s
    return in_checker._index[word]

in_checker('abc', 'tttrrrabcwww');  # O(n)
in_checker('abc', 'tttrrrabcwww');  # O(1)

Answer 4 · 2015-02-25 11:32:09

Ещё можно попробовать:

[lambda x: x is word for x in s]

Но не уверен, что это будет быстрее, чем то, что предложил Pavel Denisov

Answer 5 · 2015-02-25 11:47:06

Алексей Guest007 @Guest007

Django, Python, Linux и всё такое...

(True if word in s else False)

Ответ написан более трёх лет назад

1 комментарий

Как оптимизировать код на Python (поиск в строке)?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт