Почему быстрая сортировка Хоара медленнее пузырьковой?

Question

Иван Пакеев @ipakeev

Почему быстрая сортировка Хоара медленнее пузырьковой?

Код алгоритмов сортировки:

import numpy as np


def selection_sort(a): 
    length = len(a)
    for i in range(length - 1):
        index = i
        for j in range(i+1, length):
            if a[j] < a[index]:
                index = j
        a[i], a[index] = a[index], a[i]


def insertion_sort(a): 
    for i in range(1, len(a)):
        j = i
        save = a[j]
        while j > 0 and a[j-1] > save:
            a[j] = a[j-1]
            j -= 1
        a[j] = save
        
        
def bubble_sort(a): 
    is_sorted = False
    j = len(a) - 1
    while not is_sorted:
        is_sorted = True
        for i in range(j):
            if a[i] > a[i+1]:
                a[i], a[i+1] = a[i+1], a[i]
                is_sorted = False
        j -= 1


def quick_sort(a):
    if not a:
        return a
    x = np.random.choice(a)
    left = [i for i in a if i < x]
    mid = [i for i in a if i == x]
    right = [i for i in a if i > x]
    return quick_sort(left) + mid + quick_sort(right)

a = list(np.random.randint(0, 10, 1000))
%timeit selection_sort(a)

a = list(np.random.randint(0, 10, 1000))
%timeit insertion_sort(a)

a = list(np.random.randint(0, 10, 1000))
%timeit bubble_sort(a)

a = list(np.random.randint(0, 10, 1000))
%timeit quick_sort(a)

Python 3.7.11 выдает примерно следующие результаты:
28.3 ms ± 182 µs per loop (mean ± std. dev. of 7 runs, 10 loops each) # selection_sort
135 µs ± 2.36 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each) # insertion_sort
80.7 µs ± 302 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each) # bubble_sort
391 µs ± 4.93 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each) # quick_sort

Что не так с реализацией алгоритма quick_sort?

Вопрос задан более трёх лет назад
191 просмотр

1 комментарий

Подписаться 1 Средний 1 комментарий

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Решения вопроса 1

Комментировать

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+2 ещё

Простой
Где хранить сессию SQLAlchemy в FastAPI: в конструкторе сервиса или передавать в каждый метод?
- 1 подписчик
- 10 часов назад
- 26 просмотров
0

ответов
Python

+3 ещё

Простой
Авто торговля на байбите?
- 1 подписчик
- 15 мая
- 347 просмотров
1

ответ
Python

Простой
Как научиться извлекать математическую модель для решения задач на программирование?
- 1 подписчик
- 14 мая
- 251 просмотр
2

ответа
Python

+3 ещё

Средний
Как перенести позу SMPL модели на игровую 3д модель?
- 2 подписчика
- 10 мая
- 286 просмотров
1

ответ
Python

+1 ещё

Простой
Как при вызове хранимой процедуры получать значения RAISE NOTICE?
- 2 подписчика
- 13 апр.
- 282 просмотра
2

ответа
Python

+2 ещё

Простой
Почему не работает Selenium?
- 1 подписчик
- 09 апр.
- 321 просмотр
2

ответа
Python

Простой
В чем ошибка в использовании ft.ResponsiveView в данном коде?
- 1 подписчик
- 08 апр.
- 104 просмотра
1

ответ
Алгоритмы

Простой
Как реализовать поиск слов в файлах?
- 2 подписчика
- 06 апр.
- 333 просмотра
3

ответа
Python

Простой
Можно ли указывать во flet heigh и width через проценты?
- 1 подписчик
- 02 апр.
- 120 просмотров
1

ответ
Python

Простой
Как правильно позиционировать элементы во flet?
- 1 подписчик
- 02 апр.
- 108 просмотров
1

ответ
Показать ещё Загружается…

Скорее всего причина именно в реализации, а точнее в создании кучи копий массивов. Но я в питоне ен силен - поэтому в комменты и пишу.

Вы же меряете не только саму сортировку, но и все затраты на выделение памяти, вызов метода и прочее.

Answer 1 · 2021-12-08 12:08:07

Во-первых, quicksort медленне всяких пузырьков на маленьких числах. Это нормально. У него ассимптотика лучше - он сильно быстрее на больших числах. Но константа из-за сложности алгоритма хуже - поэтому на маленьких числах он и проигрывает пузырьку. Во всех библиотечных реализациях квиксорта (да и любой другой логарифмической сортировки) там есть проверка, что если чисел мало, то запускать пузырек или сортировку вставками.

Увеличте размер сортруемых массивов до 100 000 или до миллиона и квиксорт должен стать быстрее.

Во-вторых, ваша быстрая сортировка написана весьма неоптимально. Пузырек у вас сортирует сам массив на месте, когда как квиксорт постоянно создает новые массивы через конкатенацию. Возьмите нормальную реализацию и на 1000 элементах квиксорт уже станет быстрее пузырька.

Answer 2 · 2021-12-08 12:05:39

Дело не в реализации.
Быстрая сортировка она действительно "быстрая" в случае частично-упорядоченных массивов (которые в реальных задачах могут встречаться не реже, чем полностью неупорядоченные). Причем для корректного исследования не достаточно взять фиксированное количество элементов, а необходимо выполнить сравнения при разном N. И вообще, в O()-нотации, это не столько о времени конкретного выполнения, сколько о том, как изменяется (растет) время выполнения алгоноитма в зависимости от N.

Вопрос обсуждается в интернет в огромном количестве статей. Ну например:
https://habr.com/ru/post/274017/
https://works.doklad.ru/view/w4c2OLj2iMk.html

Почему быстрая сортировка Хоара медленнее пузырьковой?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт