Возможно ли создать скрипт — парсер, который будет писать данные в файл?
Стоит задача: записать данные из одного блока на многостраничном сайте. Таких блоков около 3500 штук. Каждый блок отдельная страница, где и хранится необходимая информация.
Вопрос такой: возможно ли создать парсер (если я правильно понимаю его смысл), который бы "прошелся" по этим страницам сайта, и собрал данные (только текст) из указанного блока (к примеру в теге div к которому присвоен class="title"), а после сделал запись с этими данными в файл txt?
Возможно, подобное можно сделать иным способом, но пока идей нет. Вероятно, кто-то делал подобное и подскажет, каким образом реализовали.
лучше, если есть уже идеи, с голого нуля вам тут жевать не будет никто, тут более менее специалисты, цените ихнее время!
ваш предполагаемый скрипт случаем не там же, где и сайт, будет располагаться? может нужно просто банально получать данные из БД?)))
alex-1917, в моем посте нет просьбы сделать за меня. Я лишь спросил, возможно ли подобное, или идею можно реализовать по другому. И лишь попросил поделиться (подсказать) способами, которыми подобное можно реализовать.
Андрей, другой способ? как пройтись по всем страницам и собрать инфу? это и есть определение парсера... или вам нужны разные способы исполнения парсера?.. вопрос какой-то детский...
ок, вот вам другой способ, БЕЗ ПАРСЕРА:
нанимаете на бирже народ (студентов), они ручками открывают все страницы и записывают искомое на бумажку, затем нанимаете студента с последних курсов (поопытнее) и он с бумажек переносит в файл txt - задача решена!
Есть такой способ - открыли страницу, скопировали текст, сохранили в файл txt, далее повторяем по необходимости нужное количество раз.
Я, например, провел тест и затратил на 100 таких приёмов 300 секунд с учетом что страницы открываются быстро.
таким образом, через 9000-12000 секунд Ваша задача будет решена.
alex-1917, да, здесь я отдыхаю, решаю интересные задачи, общаюсь, отдых мозга и переключение между типами задач реально повышает продуктивность, так что это немного другой вид деятельности нежели копопаст в течении 4 часов.
Это классический парсер.
1. В программе указываешь ссылки где находится контент.
2. Выполнив к ним запрос получаешь контент.
3. "Копаешься" в этом контенте, и извлекает только то, что нужно.
4. Что-то с этим делаешь (сохраняешь в бд, файлы, шлёшь письма, ...).