Как написать бота для Парсинга?

Хочу профессионально заняться парсингом сайтов для составления аналитических отчетов для бизнеса. И вот как новичок прошу дать алгоритм с чего начать!
1. На каком языке пишутся боты для Парсинга?
2. Где изучать язык?
3. Какие библиотеки (решения) уже разработаны для этих задач (парсинг)?
4. Какие риски связанные с парсингом есть?
5. Для хранения данных какие БД использовать?
6. Существует Гайд, курсы, или есть менторы которые могут обучить этому ремеслу?

Буду рад если поделитесь дополнительной информацией, помимо заданых вопросов выше!
  • Вопрос задан
  • 2465 просмотров
Пригласить эксперта
Ответы на вопрос 1
@tabbols95
Недопрограммист
1. Смотря какой функционал вы рассматриваете. Python вполне неплохо подходит для парсинга необходимой информации с сайтов (сам им пользуюсь). Использую всего навсего сам python и библиотеки BeautifulSoup, requests, selenium, pyautogui. Неплохо было бы разобраться с сист. контроля версий, pip и прочее.
2. Интернет в помощь. Стати на habr, Ютуб. Изучать лучше всего на практике, имея конкретные задачи.
3. Привел в первом пункте, но также для записи файлов .csv необходима доп. библиотека. Для начала хватит, а потом развиваться в путь давать волю фантазиям.
4. С каждым сайтом конечно нужно согласование на автоматический сбор данных иначе на Вас могут подать в суд.
Учитесь, учитесь и еще раз учитесь.
Можно код смотреть на github, там многие выкладывают)
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы