Было дело работал с российскими нормативными документами гостами. По сталям и фиттингам для трубопроводов.
1. Качество pdf очень важная история. Если совсем плохое парсер не возьмет (нужно искать в интеренте) есть открытые нормативные базы.
2. парсеры (tabula, camelot) с множеством настроек, в зависимости от того, как настроишь зависит практически все.
3. Ну и pandas обе библиотеки вернут список с дата фреймами, где фрейм это каждая таблица. Обычно требует много пост процессинга, например две таблицы на странице а их конкатенировать одна на одну, таблицы имеют "многоуровневую шапку" column multi index на языке пандаса и т.д.
После пункта три, до желаемого результата одна строчка кода.