API last.fm и сбор базы данных сотен тысяч пользователей с частотой прослушивания ими последних треков за год. Какие трудности могут возникнуть?

Question

IvvanIvvanovv @IvvanIvvanovv

Last.fm

API last.fm и сбор базы данных сотен тысяч пользователей с частотой прослушивания ими последних треков за год. Какие трудности могут возникнуть?

Замысел такой, по шагам:
1. Если не ошибаюсь, непосредственно через API этот шаг не удастся реализовать, поэтому без API, спарсить слушателей любимых исполнителей. На страницах исполнителей есть раздел Listeners и там на 9 страницах суммарно 270 слушателей - самых активных, на сколько понял.
2. Опять же через API, на сколько понимаю, соседей пользователей получить не удастся, поэтому спарсить их.
3. Друзей этих пользователей получить через API. В итоге получится список из скольких то десятков или сотен тысяч пользователей для последующего анализа их профилей.
4. С помощью API получить статистику прослушиваний треков каждым пользователем за последний год. Сохранить наиболее часто прослушиваемые треки пользователей с привязкой к их логину.
5. Взять свой список для сравнения.
6. Определить формулы для расчетов. Например из топ-100 треков за год, среднее количество прослушивания трека у пользователя 5, а у меня 10, т.е. в 2 раза больше - это привести к общему знаменателю и сравнить все треки из топ-100. В случае схождения треков приравнять каждому сошедшемуся треку величину от 0.1 до 1 и умножить на количество схождений из топ-100, таким образом получив рейтинг общего пересечения в топ-100 за год между каждым пользователем и собой.

В этих изощрениях мне видится смысл в контексте несовершенства алгоритма подбора соседей по музыкальным вкусам, который подбирает соседей по исполнителям, а не по трекам. У каждого исполнителя могут быть сотни треков и те пара треков, которые слушаю я, скорее всего не слушают те, кого last fm определяет мне в соседи, таким образом заходя в профили этих "соседей", я никогда не найду новых интересных для меня музыкальных треков и буду долго плеваться, а возможно даже страдать от головной боли после прослушивания того что в мои вкусы совершенно не вписывается. Музыкальные рекомендации сервиса столь же далеки от моих предпочтений, как и вкусы этих "соседей", поэтому пытаюсь изобрести что то свое. Рекомендации других сервисов тоже не идеальны. Да и попрограммировать чего нибудь хочется.

Вопрос: с какими проблемами могу столкнуться при реализации своего алгоритма, помимо того что ID пользователей придется парсить, поскольку через API их получить не удастся? Да и на сколько терпелив last fm? Нечто подобное делал для vk и там были сложности, на сколько помню, в том что когда стал активно получать списки аудио сотен тысяч пользователей, vk что то изменил и перестал выдавать целиком весь список аудио каждого пользователя, который мог доходить до 10000 композиций, и начал отдавать список микродозами по 100, разумеется запрашивая каптчу после каждой... До тех пор как vk внесли изменения, схема работала и редко, но попадались пользователи с повышенным числом схождений, а среди их аудио удавалось находить новую музыку для себя, минуя кровь из ушей.

П.С.
А может нечто подобное (поиск пользователей по сходящимся трекам, а не исполнителям треков) уже существует?
На сколько это могло бы быть полезно/востребовано для других? Мнения/советы/рекомендации по своей идее хотел бы услышать.

Вопрос задан более трёх лет назад
202 просмотра

4 комментария

Подписаться 1 Средний 4 комментария

Алан Гибизов @phaggi

См.п.5.11

Написано более трёх лет назад
IvvanIvvanovv @IvvanIvvanovv Автор вопроса

Алан Гибизов, какое отношение мой вопрос имеет к соцопросам?

Написано более трёх лет назад
Алан Гибизов @phaggi

IvvanIvvanovv, к соцопросам - никакого. А к опросам - прямое.

Тут другая модель использования ресурса:
Вы описываете проблему, показываете свою попытку решения, входные данные, что ожидаете и что не получается. И просите показать, что не так.

Ваш вопрос, на мой взгляд, не очень подходит данному ресурсу.

Ну, и потом - при чём тут тег Python? 30К подписчиков тега вынуждены видеть этот вопрос, не интересный им никаким боком. Рекомендую убрать тег Python и поставить, к примеру, «Алгоритмы» или «Проектирование ПО».
Либо вставьте в вопрос свой код на Python, относящийся к вопросу. Тогда хоть какой-то смысл будет.

Написано более трёх лет назад
IvvanIvvanovv @IvvanIvvanovv Автор вопроса

Алан Гибизов, Убрал тег Python.

Написано более трёх лет назад

Помогут разобраться в теме Все курсы

Нетология

1C-программист: расширенный курс

18 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия DevOps-инженер + ИИ

5 месяцев

Далее

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Last.fm

Средний
Распознать названия отдельных треков в миксах?
- 2 подписчика
- более трёх лет назад
- 692 просмотра
1

ответ
iTunes

+1 ещё

Простой
Есть ли сервис загрузки фото исполнителя для собственного плеера?
- 2 подписчика
- более трёх лет назад
- 73 просмотра
0

ответов
JavaScript

+2 ещё

Средний
Как получить только время с Last FM API?
- 1 подписчик
- более трёх лет назад
- 99 просмотров
1

ответ
Perl

+1 ещё
Как забрать пароль из файла?
- 1 подписчик
- более трёх лет назад
- 176 просмотров
2

ответа
ВКонтакте

+3 ещё
Возможен ли быстрый импорт всей музыки из Вк в Last.fm?
- 3 подписчика
- более трёх лет назад
- 1360 просмотров
2

ответа
Компьютерные сети

+2 ещё
Подключить Last.fm к ВКонтакте?
- 2 подписчика
- более трёх лет назад
- 11220 просмотров
2

ответа
Аудио

+1 ещё
Будет ли пользоваться спросом аналог LAST.FM?
- 1 подписчик
- более трёх лет назад
- 382 просмотра
1

ответ
Программирование

+1 ещё
Существуют ли открытые системы подбора контента на основе собранной статистики по типу last.fm?
- 5 подписчиков
- более трёх лет назад
- 2497 просмотров
1

ответ
Аудио

+1 ещё
Как перенести наскробленное на Last.fm из одного аккаунта в другой?
- 2 подписчика
- более трёх лет назад
- 4042 просмотра
1

ответ
Показать ещё Загружается…

Алан Гибизов, какое отношение мой вопрос имеет к соцопросам?
IvvanIvvanovv, к соцопросам - никакого. А к опросам - прямое.

Тут другая модель использования ресурса:
Вы описываете проблему, показываете свою попытку решения, входные данные, что ожидаете и что не получается. И просите показать, что не так.

Ваш вопрос, на мой взгляд, не очень подходит данному ресурсу.

Ну, и потом - при чём тут тег Python? 30К подписчиков тега вынуждены видеть этот вопрос, не интересный им никаким боком. Рекомендую убрать тег Python и поставить, к примеру, «Алгоритмы» или «Проектирование ПО».
Либо вставьте в вопрос свой код на Python, относящийся к вопросу. Тогда хоть какой-то смысл будет.

API last.fm и сбор базы данных сотен тысяч пользователей с частотой прослушивания ими последних треков за год. Какие трудности могут возникнуть?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт