var_1 = 'ebro EBI 310 TE Temperature data logger'
var_2 = 'EBRO EBI 310 TE USB-LOGGER'
var_3 = 'EBRO EBI 310 TE Temperature-LOGGER'
var_4 = 'ebro EBI 310 TE data-LOGGER'
# множества слов
set_1 = set(var_1.upper().split())
set_2 = set(var_2.upper().split())
set_3 = set(var_3.upper().split())
set_4 = set(var_4.upper().split())
# множество слов входящих в пересечение
intersect = list(set_1.intersection(set_2,set_3,set_4))
print('пересечение: ', intersect)
def get_str(str__, intersect):
# берем из строки только слова входящие в пересечение
resultwords = [word for word in str__.split() if word.upper() in intersect]
return ' '.join(resultwords)
print(get_str(var_1, intersect))
print(get_str(var_2, intersect))
print(get_str(var_3, intersect))
print(get_str(var_4, intersect))
Есть ли какие-то готовые библиотеки для создания этих документов к примеру из стандартных форматов pdf и xml? - Нет.
Есть отдельные либы для работы с XML и отдельные с PDF.
1. xmlschema
Валидация XML на соответствие схеме XSD, конвертор из JSON и в JSON, в соответствии со схемой.
2. Разные XML парсеры, генераторы.
3. Разные либы для создания и манипуляции PDF. PyPDF2, ReportLab, и другие.
UPD
"PDF/A-3 содержит только одно необходимое, но спорное изменение: PDF/A-2 уже позволяет встраивать PDF/A-совместимые документы в виде вложений. Однако PDF/A-3 впервые позволяет встраивать файлы любого формата, например Excel, Word, HTML, CAD или XML."
То есть это просто пдф который позволяет встраивать в себя файлы.
Поддержка стандартов PyPDF2 https://pypdf2.readthedocs.io/en/latest/user/pdf-v...
PyPDF2 вроде как позволяет встроить файл в пдф https://stackoverflow.com/questions/59085308/how-t...
Есть SpiderMonkey
- автономный интерпретатор JS, в линуксе из коробки, в винде - нет вообще
можно запустить через subprocess('/usr/bin/js60', 'tvoi_script.js'), как-то так.
так же есть WebKit JavaScript, приблизительно то-же самое.
как-то так