Почитайте "Грокаем алгоритмы" книжка на 1 вечер, но сэкономит тучу времени на понимание основ. В ней есть лишь часть алгоритмов, но разжевано до основания, потому и на 1 вечер. Структуры тоже представлены частично.
Для автоматизации страниц средствами javascript раньше использовали TemperMonkey выгрузка чего-либо в файлы тоже через javascript. Распишите ещё критерии, в user script'ах обычно автозапуск при переходе на целевую страницу. В остальных случаях интерфейс придётся видимо самому писать.
Нет защиты как таковой. Защита это высокая степень ненужности информации и необходимость использования большого количества ресурсов для её добычи.
Можете использовать сторонние сервисы для защиты(не идеально), отсечёт 98% парсеров.
Но забавно конечно парсим и хотим от этого защититься. XD