NumPy как переписать алгоритм?

Question

kAIST @kAIST

Python
NumPy

NumPy как переписать алгоритм?

На входе один numpy массив и так же множество массивов, с которым его нужно сравнить и выдать те, которые наиболее "похожи". Делается это так:

input_array= np.array(....)
many_arrays=[np.array(....),np.array(....), .... ]
dists = np.linalg.norm(many_arrays-input_array, axis=1) 
ids = np.argsort(dists)[:20] #получаем первые 20 индексов максимально "похожих" на input_array

А как быть, если input_array это не один массив, а N массивов? То есть нужно получить список массивов, которые максимально похоже ко всем из input_array?
Хочется максимально элегантного решения, вдруг оно делается в пару строк )

Вопрос задан более трёх лет назад
72 просмотра

Комментировать

Подписаться 1 Средний Комментировать

Пригласить эксперта

Ответы на вопрос 2

2 комментария

dmshar @dmshar

scipy.spatial.distance.pdist(X, metric='euclidean', *args, **kwargs)
Pairwise distances between observations in n-dimensional space.
Вопрос, каким образом использовать предложенную функцию для измерения расстояний между элементами ДВУХ векторов, причем так, что бы учесть все возможные пары??

Написано более трёх лет назад
U235U235 @U235U235
Перепутал pdist с cdist...

import numpy as np from scipy.spatial.distance import cdist many_arrays=np.array([[1, 2, 3],[4, 5, 6]]) many_arrays2=np.array([[1, 2, 3],[4, 5, 6]]) print(cdist(many_arrays, many_arrays2))

Выдает матрицу попарных расстояний

[[0. 5.19615242] [5.19615242 0. ]]

Далее argmin ом находятся индексы наиболее похожих векторов.
Написано более трёх лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Python

+2 ещё

Простой
Как установить 2 версии libssl в kubuntu 22.04?
- 1 подписчик
- час назад
- 8 просмотров
0

ответов
Python

Простой
Как в библиотеке Flet при нажатии на кнопку сделать, чтобы появилось всплывающее окно?
- 1 подписчик
- час назад
- 7 просмотров
0

ответов
Python

+1 ещё

Сложный
Интерпретация результатов модели lambdamart?
- 1 подписчик
- 3 часа назад
- 15 просмотров
0

ответов
Python

Простой
Как в конце каждой строки файла добавить тэг?
- 1 подписчик
- 23 часа назад
- 112 просмотров
1

ответ
Python

+1 ещё

Простой
Почему asyncio.current_task() не передается в функцию?
- 1 подписчик
- 23 часа назад
- 78 просмотров
1

ответ
Python

+2 ещё

Простой
Срабатывает антивирус на скомпилированный файл python, как исправить?
- 1 подписчик
- вчера
- 187 просмотров
1

ответ
Python

Простой
Почему не срабатывает if? как это пофиксить?
- 1 подписчик
- вчера
- 143 просмотра
2

ответа
Python

+2 ещё

Простой
Как транслировать аудио в микрофон, py, c#, c++?
- 1 подписчик
- 22 апр.
- 166 просмотров
3

ответа
Python

Средний
Почему Низкий FPS анализ изображения yolov8 YOLO?
- 2 подписчика
- 22 апр.
- 33 просмотра
0

ответов
Python

+2 ещё

Простой
Почему Планировщик задач Windows 10 не выполняет скрипт Python?
- 3 подписчика
- 22 апр.
- 2003 просмотра
3

ответа
Показать ещё Загружается…

Team Lead (С++, Python)

TopAssistant • Москва

от 400 000 ₽

Python developer

Bell Integrator

До 350 000 ₽

Python developer

Greenway Global • Новосибирск

от 150 000 ₽

Установить вебхук на сайт

24 апр. 2024, в 16:19

4000 руб./за проект

Натянуть верстку Опенкарт

24 апр. 2024, в 15:34

20000 руб./за проект

SEO с опытом в контентных проектах (СМИ)

24 апр. 2024, в 15:32

130000 руб./за проект

Answer 1 · 2021-04-04 23:15:35

Ну, в пару или нет - считайте сами:

import itertools
import numpy as np
many_arrays=[np.array([1,2,3]),np.array([4,5,6]), np.array([7,8,9]) ]
many_arrays2=[np.array([1,2,3]),np.array([4,5,6]), np.array([7,8,9]) ]
prd=itertools.product(many_arrays,many_arrays2)
dists=[]
for it in prd:
    dists.append([np.linalg.norm(it[0]-it[1]),it[0],it[1]])
sorted(dists, key=lambda x: x[0])

Результат:
[[0.0, array([1, 2, 3]), array([1, 2, 3])],
[0.0, array([4, 5, 6]), array([4, 5, 6])],
[0.0, array([7, 8, 9]), array([7, 8, 9])],
[5.196152422706632, array([1, 2, 3]), array([4, 5, 6])],
[5.196152422706632, array([4, 5, 6]), array([1, 2, 3])],
[5.196152422706632, array([4, 5, 6]), array([7, 8, 9])],
[5.196152422706632, array([7, 8, 9]), array([4, 5, 6])],
[10.392304845413264, array([1, 2, 3]), array([7, 8, 9])],
[10.392304845413264, array([7, 8, 9]), array([1, 2, 3])]]

Answer 2 · 2021-04-05 07:21:57

U235U235 @U235U235

В scipy есть scipy.spatial.distance.pdist¶
По-моему это то, что вам нужно.
Поправлю: cdist, конечно же.

Ответ написан более трёх лет назад

2 комментария

NumPy как переписать алгоритм?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт