Как писать программу, которая ищет в коде элемента сайта нужные данные?
Цель:узнать, что на сайте появился новый объект(объект, то появляется, то исчезает). Если делать это все в ручную, то алгоритм действий такой, код элемента, нахожу класс "гифт...", когда появляется объект, то в этом классе появляется подкласс, отвечающий за этот объект. Следовательно алгоритм такой, открыть код элемента, в коде искать нужное название(так как у подкласса оно всегда одно), если в коде такое название есть, то объект появился, если нет, то объекта нет. Это возможно реализовать программно? Если да, то каким языком писать программу и как с помощью этого языка получить доступ к коду элемента страницы? Если сама идея звучит безумно, извините, в сайтоделии не смыслю, а так порылся в коде элемента, понаблюдал и пришел к вышесказанным выводам.
Только у меня есть пару вопросов, первый, парсер может вытягивать информацию исходного кода веб-страниц, в исходном коде нужной мне инфы нет, в исходном коде показывается только класс "гифт...", а подклассы там не показываются, следовательно я не смогу никогда найти нужное название, или исходный код страницы парсер сможет раскрыть на все подклассы?, Второй вопрос, в интернете все парсеры рассчитаны ни на один сайт, т.е чтобы написать нужным мне парсер, мне надо будет скачивать один из языков для создания парсеров(питон, пхп...)?
Geoler, парсер, если ты его скачиваешь, как готовый код, можно представить себе как функцию:
парсер(сайт, элемент);
Где в качестве элемента указывается например, div#gift, в котором будут происходить обновления. Парсер делает запрос по указанному url сайта и возвращает тебе, скорее всего, строку в виде html-кода, где ты уже можешь вытащить все вложенные элементы в данный div.
Чтобы парсер проверял несколько раз в день - тебе надо иметь на хостинге Crontab и настроить его. Поэтому, если у тебя запара с любым языком программирования, то лучше поискать сервис с кнопками (такие наверняка есть, но скорее всего платные). Если JS знаешь уверенно, то парсер на JS наверняка существует, опять же, вопрос к гуглу.
Сергей Мелодин, спасибо, запары нет, я их просто не знаю, кроме Паскаля, а так я думаю, что раз паскаль знаю, то и в другом языке в целом алгоритмично разобраться можно, поэтому я так понял, что цикл - повторяться раз в минуту и в нем функция с анализатором полученных данных, какой язык посоветуете, чтобы удобнее было писать такую программу?
Geoler, цикл не будет выполняться сам по себе. Должен быть постоянно включен компьютер для того, чтобы код постоянно работал, то есть сервер. На серверах есть планировщики задач (Crontab), которые запускают по расписанию скрипт, который делает запрос и возвращает какой-то результат. Не знаю, можно ли это реализовать на бесконечном цикле с минутным шагом, но мне кажется, что нельзя (или я просто об этом не слышал).
Серверный язык, который годится для задач Crontab - это PHP, он легко осваивается. Можно ли такое сделать на Паскале - я не знаю. Честно говоря, парсеры - не моя тема, просто имел опыт и подсказал вам направление гуглёжки. Думаю, что выбор языка надо возложить на себя, потому что NodeJS, PHP, Python и что там ещё вплоть до С - должно быть личным выбором )
Сергей Мелодин, спасибо, не, ну я понимаю, что должен быть всегда включен комп, за языки тоже спасибо, о пхп вроде как недавно читал, как о языке для лёгкого получения данных с сайта,
Geoler, да, PHP имеет множество готовых решений и CURL, как современный способ маскироваться под браузер. Но, возможно, на других языках не менее широкие возможности. Тут уж зависит от разраба большей частью.