god_dan63, с помощью 
парсеров, разумеется. В зависимости от того, что надо разбирать, выберите парсер, изучите его документацию и сделайте программу. Если не заработает, как ожидалось - приносите код и traceback ошибки, тогда будет больше шанс получить полезный ответ. 
В вашем конкретном случае можно использовать bs4 для html варианта либо 
python-docx  для word. Оба позволяют вычленить таблицы и работать с ними. Первый немного более низкоуровневый. В зависимости от вашей квалификации как программиста может быть легче в более гибком, но «сложном» bs4 или несколько более ограниченном, но «простом» python-docx.