Задача: Имеется страничка
tourdom.tv/happy-hour/schastlivyj-chas , каждый день обновляемая. На которой повторяющиеся каждый день пункты: Цена, Дата, кол-во дней, Страна, город и т.д. Надо сделать алгоритм (скорее всего написать программу) который будет парсить указанную страничку и находить определенное значение (например "следующие два слова после слова "турпакет:", или цифру перед словом "дней"), копировать это значение и вставлять в указанное место (текстовый фаил).
Пример: на первой страничке турпакет про Грецию должен в текстовом виде принять такое вид:
Греция, о.Закинф
Заезд 04.05.2014
8 дней
25 500 руб. с чел.
(~ 567 €)
Перелет: а/к Astra Airlines
Отель: Mabely Grand Hotel 5*
Номер: DBL, стандарт
Питание: полупансион (НB)
Далее это я все, пока тоже вручную, экспортирую в photoshop (но это второстепенная пока задача)
На каком языке это можно несложно реализовать? Учитывая что ни один не изучал, но время есть, вроде программа не кажется такой уж сложной. Сейчас это все делается вручную и занимает определённое время. Я человек с техническим складом ума верю что это можно оптимизировать.
Я предполагаю что программа должна парсить html код (возможно, или как вариант просто copy\paste всей странички в любом текстовом редакторе), находить определенные слова и по алгоритму копировать слово\символы\предложение, уметь обрабатывать некоторые исключения и вставлять в заранее подготовленный шаблон, или генерировать заданный шаблон самостоятельно. Спасибо.