Доброго дня, уважаемые гуру разработки
подскажите, пожалуйста, какие есть общие подходы для программного извлечения данных с веб-сайтов? Нужно написать скрипт(например на python/groovy) который просканировав ресурс
en.wiktionary.org сохранил бы в файл имена существительные с него