Ответы пользователя по тегу Парсинг
  • Как парсить число из HTML с помощью C#?

    @kttotto
    пофиг на чем писать
    Это ангуляровская страница и значение является биндигом, которое для получения результата может например делать еще какой то запрос. Вообщем, если Вы получаете страницу запросом через HtmlClient (ну или RestSharp), то Вы получите страницу с неотработанными js скриптами, они то должны выполниться на стороне клиента в браузере после загрузки страницы. Поэтому Вы получите {{column.getValue(item)}}, но если этот результат получит браузер, то он выполнит скрипты и там будет значение.
    В общем решением может быть грузить страницу, например через Selenium (WebDriver) или через Phantom и уже с них доставать значение.

    Вот еще есть вариант. Я так не пробовал, но пишут, что так можно запустить js код, попробуйте.
    Ответ написан
    3 комментария
  • Как противодействовать парсингу сайта?

    @kttotto
    пофиг на чем писать
    Чтоб парсить, надо определить какой-то шаблон, как искать и по какому критерию. Тут вариант, усложнять задачу: капчи - для отображения какой то инфы, просите каких то подверждений от клиента. Ломайте теги, где это можно сделать безболезненно, не закрывайте их, реализуйте показ одной и той же инфы разными способами. Вобщем добавте гемора писателям парсеров) Как только заметили, что кто-то парсит - измените страницу по мелочи.
    Ответ написан
    Комментировать