1998or2
@1998or2
Агрессивное программирование

Как парсить (python/django) рейтинг IMDb и Кинопоиск себе на сайт?

Как парсить на python/django рейтинг IMDb и Кинопоиск себе на сайт?
Чтоб цифры рейтингов брались с сайтов источников (IMDb и Кинопоиск) и при изменении рейтинга например на IMDb - рейтинг так же менялся и на моем сайте.
  • Вопрос задан
  • 869 просмотров
Пригласить эксперта
Ответы на вопрос 1
datka
@datka
В теории тебе нужна база данных где будут храниться рейтинги. Потом надо решить, ты будешь парсить весь IMDB/Кинопоиск или у тебя будет список фильмов-сериалов для которых надо будет искать рейтинг.

1) Если весь IMDB/Кинопоиск. То тебе придется парсить каждый фильм по отдельности. Брать оттуда рейтинг и класть в базу. На этом этапе надо подумать, как сделать так что-бы твой IP addr не забанили за парсинг. Плюс ко всему прочему такое может быть что название фильма на IMDB не будет совпадать с названием фильма на Кинопоиске, а это отдельный геморой. Также не забываем время за которое сделается парсинг.

2) Если список фильмов-сериалов для которых надо будет искать рейтинг. Тут немного попроще, делаешь список и может через API, может через requests делаешь поиск по сайтам фильма. Дальше парсишь ссылку на сам фильм и берешь рейтинг если в поиске конечно не показывает рейтинг.

Так ты получишь рейтинг IMDB / Кинопойска. А потом Надо будет решить как обновлять рейтинг. Тут тоже много гемороя. Ну и как это всё прикрутить к django

ПС: последуй примеру как тебе написали в коментах. Начни с простого.
Ищи в гугле: BeautifulSoup, Selenim, Requests, Python
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы