@Floki_SMD

Парсинг для начинающих, что изучать?

Добрый день.
Задался целью парсить бук контору, которая написана на java.
Суть в том, что для парсинга, как я уже немного разобрался, нужен будет Selenium, чтобы считывать данные, которые появляются только после клика на статистику матча(в коде сайта я не нашёл, возможно не хватает опыта и знаний в структуре сайтов).
Изначально начал изучать азы С#, но почитав форумы по данной теме, люди советуют лучше писать на Питоне или Java.
Я готов учиться, но информации не так и много в интернете на данную тему.
В данный момент представляю, что такое массивы и как с ними обращаться(в теории), практики большой не имею.
Если есть профи, подскажите, что почитать, изучить, цель-написать самому, код парсинга я не прошу, прошу помочь с литературой, а дальше уже дело техники, буду учить.
Заранее спасибо тем, кто уделит хотя бы минутку моей просьбе.
  • Вопрос задан
  • 155 просмотров
Решения вопроса 1
samodum
@samodum
Какой вопрос - такой и ответ
Абсолютно не важно на чём писать. Основная ошибка всех новичков.
Важно понимать как работает протокол HTTP/HTTPS, что такое хедеры, куки, понимать аутентификацию, сессии, методы (get, put, update,...), статусы ответов,... Понимать что такое прокси, VPN... и для чего они нужны, как их использовать. Нужно понимать, как работает сервер, как он может защищаться от парсинга.
Изучи модель OSI, из каких слоёв/уровней она состоит
Ответ написан
Пригласить эксперта
Ответы на вопрос 2
firedragon
@firedragon
Senior .NET developer
Смотрите на шарпах есть htmlagility пробуйте его. Ну и ищите c# scrapping
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы
ЭЛКОМ+ Москва
от 70 000 до 165 000 ₽
deeplay Новосибирск
от 130 000 до 200 000 ₽
от 3 500 до 4 000 $