Вы не в том разделе написали данный вопрос.
Если такое и делать, а с описанного выходит, что файлы хранятся у вас, а не грузятся в браузере, то только в скрипте каком то, который может отрабатывать на клиенте (речь идет не о браузере).
Скрипт у себя на компе натравливать на папку с контентом ну или скормить архив.
В процессе обхода всех файлов(может даже и заданного формата) с папки/папок/архивов, вытаскивать контент с body и экспортировать в нужном формате в нужный файл или на нужный скрипт.
Можно попробовать на баш скрипт набросать, вот только не помню в синтаксисе, что в отношении поиска контента по файлах, есть ли такое. Так же можно пытаться писать скрипт на руби, пхп или еще каком то языке программирования. Хотя допустим если пропустить через ноджс, то можно и на яваскрипте написать.
Хотя допустим, если файлы не хранятся у пользователя, а есть набор ссылок, то тогда можно уже рассматривать написание чисто на яваскрипте (при условии, что можно куда то запостить результат). Сделать массив ссылок, обходя которые по очереди открывать новое окно, вытаскивать с него контент, сохранять в объекте, а потом это все куда то отправить... Замечу, что именно отправить, т.к. яваскрипт не способен по ограничениям безопасности работать с файлами у пользователя. Он может только в локальные хранилища, что то пытаться сохранять и то только в фф/хроме. Хотя ИЕ раньше имел уязвимость(презентованную как фишку браузера), позволяющую создать у пользователя файл, открыть файл, создать к нему поток данных, записать поток в файле, закрыть файл но в были выпущены фиксы, которые прекращали возможность создания потоков данных к файлам и последующую запись.
А вообще изначально для таких целей (когда мне надо было вытаскивать чать контента с разных сайтов периодично), написал в хром расширение, которое научил работать с множеством ссылок и обновлять инфу. Но как только большая часть функционала была накидана и работала (оставалось только добавить запуск по таймеру или открытию определенной вкладки, а не только по кнопке, ну а так же правила выборки для других ресурсов), как похожую штуку написали на пхп да и заняло меньше кода оно, чем на жс расширением, поставлено в крон и жило своей жизнью до поры до времени...