Обрабатываю текст скриптом. Проверяю, если текст большой, обрабатываю чанками, иначе целиком.
if size > max_size:
chunker = TextChunker(maxlen=max_size)
for chunk in chunker.chunk(text):
answer = get_answer(chunk,
tags_quantity=1)
tmp_json = parse_answer(answer)
result_json['summary_text'] += tmp_json['result']
result_json['tags'].extend(tmp_json['tags'])
result_json['input_size'] += answer.input_size
result_json['output_size'] += answer.output_size
else:
answer = get_answer(text,
tags_quantity=3)
tmp_json = parse_answer(answer)
result_json['summary_text'] = tmp_json['result']
result_json['tags'].extend(tmp_json['tags'])
result_json['input_size'] = answer.input_size
result_json['output_size'] = answer.output_size
return result_json
Вроде очевидно, что делается почти одно и то же. Но как-то не могу сообразить, как это красиво вынести в отдельную функцию, чтобы не городить грязь с костылями. Прошу дать какой-нибудь образчик или ткнуть в правильную статью/книгу.