@Floki_SMD

Парсинг для начинающих, что изучать?

Добрый день.
Задался целью парсить бук контору, которая написана на java.
Суть в том, что для парсинга, как я уже немного разобрался, нужен будет Selenium, чтобы считывать данные, которые появляются только после клика на статистику матча(в коде сайта я не нашёл, возможно не хватает опыта и знаний в структуре сайтов).
Изначально начал изучать азы С#, но почитав форумы по данной теме, люди советуют лучше писать на Питоне или Java.
Я готов учиться, но информации не так и много в интернете на данную тему.
В данный момент представляю, что такое массивы и как с ними обращаться(в теории), практики большой не имею.
Если есть профи, подскажите, что почитать, изучить, цель-написать самому, код парсинга я не прошу, прошу помочь с литературой, а дальше уже дело техники, буду учить.
Заранее спасибо тем, кто уделит хотя бы минутку моей просьбе.
  • Вопрос задан
  • 233 просмотра
Решения вопроса 1
samodum
@samodum
Какой вопрос - такой и ответ
Абсолютно не важно на чём писать. Основная ошибка всех новичков.
Важно понимать как работает протокол HTTP/HTTPS, что такое хедеры, куки, понимать аутентификацию, сессии, методы (get, put, update,...), статусы ответов,... Понимать что такое прокси, VPN... и для чего они нужны, как их использовать. Нужно понимать, как работает сервер, как он может защищаться от парсинга.
Изучи модель OSI, из каких слоёв/уровней она состоит
Ответ написан
Комментировать
Пригласить эксперта
Ответы на вопрос 2
firedragon
@firedragon
Не джун-мидл-сеньор, а трус-балбес-бывалый.
Смотрите на шарпах есть htmlagility пробуйте его. Ну и ищите c# scrapping
Ответ написан
Если про Python, то вот вам удочка - https://www.litres.ru/r-mitchell/skraping-veb-sayt...
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы