Это основа работы алгоритма llm gpt.
При выборе следующего токена ответа, алгоритм выбирает не тот что с большей вероятностью , это параметр temp=0 (это стабилизирует ответы но значительно ухудшает из качество) а с некоторым разбросом, чем выше temp тем больше разброс выбора и 'креативность' ответа, чаще это вода в тексте, так как с ней проще разнообразить.
На сколько я помню если нужно и temp выше 0,и стабильность, то фиксируй seed генератора случайных чисел...