Отслеживание изменений контента сайта. (C#)

Question

Justl @Justl

C#

Отслеживание изменений контента сайта. (C#)

Здравствуйте. Пишу курсовую работу. Подскажите какие алгоритмы подойдут для оптимального отслеживания контента? На данный момент изучено - парсинг XML, и сравнение хэшей картинок. Подскажите источники, где можно почитать о методах отслеживания и алгоритмах, если источник с примерами - было бы идеально.
Спасибо.

Вопрос задан более трёх лет назад
3190 просмотров

2 комментария

Подписаться 5 Оценить 2 комментария

Помогут разобраться в теме Все курсы

Нетология

Разработчик игр на Unity

13 месяцев

Далее
Академия Эдюсон

Разработчик игр на Unity + ИИ

6 месяцев

Далее
Stepik

PRO C#. Профессия "Backend разработчик"

4 месяца

Далее

Пригласить эксперта

Ответы на вопрос 2

2 комментария

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

C#

+4 ещё

Сложный
Как сделать правильную перемотку видео в Flyleaf (wpf)?
- 3 подписчика
- 15 июн.
- 209 просмотров
1

ответ
C#

+1 ещё

Средний
Как передать изображение на принтер TSC?
- 1 подписчик
- 12 мая
- 139 просмотров
1

ответ
Python

+3 ещё

Средний
Как перенести позу SMPL модели на игровую 3д модель?
- 2 подписчика
- 10 мая
- 371 просмотр
1

ответ
MySQL

+2 ещё

Простой
Как исправить ошибку could not load file or assembly «System.Data.SqlClient»?
- 1 подписчик
- 06 мая
- 110 просмотров
1

ответ
C#

+2 ещё

Простой
Как заставить кнопки в ScrollView корректно перераспределять остальные элементы при анимации?
- 1 подписчик
- 10 апр.
- 106 просмотров
1

ответ
C#

Простой
Как прочесть без блокировок в многопоточном приложение 16 байт структурное значение?
- 1 подписчик
- 30 мар.
- 196 просмотров
1

ответ
C#

+1 ещё

Средний
Как убрать проблему, из-за которой карта не возвращается в руку?
- 1 подписчик
- 18 мар.
- 310 просмотров
1

ответ
C#

Средний
Как скачать видео из MAX с параметрами C# GET?
- 2 подписчика
- 14 мар.
- 408 просмотров
0

ответов
C#

+1 ещё

Простой
Как переопределить стиль WPF-компонентов из подключенной библиотеки?
- 1 подписчик
- 02 мар.
- 125 просмотров
1

ответ
C#

Средний
Как в JsonSerializer.Deserialize игнорировать ошибки десериализации битого json?
- 3 подписчика
- 29 янв.
- 282 просмотра
1

ответ
Показать ещё Загружается…

Что вы подразумеваете под изменением? Изменение файлов сайта? Или изменение данных в БД?
Грубо говоря, изменения текста на сайте, что то типа RSS, изменения в БД я не смогу отслеживать, ибо отслеживание будет осуществляться на чужом сайте, доступа к которому, у меня попросту нет.

Answer 1 · 2014-05-30 09:34:28

Очень интересный вопрос. Вы пытаетесь сделать определение для любого сайта или конкретного? Если у любого, то некоторый блок на странице или вся страница?
Сразу всплывающие подводные камни:
1. Как быть с сайтами, где контент подгружается динамически (Ajax)?
2. Если на странице есть вывод текущего времени или зависимого от него состояния (например: "написано 10 минут назад") - это считается изменением или нет? Если нет, то как универсально отслеживать и игнорировать?
и т.д.
Или вы просто в курсовой описываете все возможные алгоритмы? Если так, то вам бы посмотреть в сторону алгоритмов работы кэш серверов.

Answer 2 · 2014-06-02 16:27:30

Можете сделать по аналогии с готовым решением, реализованным на Python
https://thp.io/2008/urlwatch/
Функционал:
построчно показывает изменения на веб-странице, подобно тому как это делается в системе контроля версий (diff).
Имеет механизмы фильтрации динамического контента.

Отслеживание изменений контента сайта. (C#)

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт