В чем преимущество позиционного кодирования синусами?
Здравствуйте ! Трансформер не учитывает позицию токена и требует позиционного кодирования. Самое просто это присвоить каждому токену его порядковый номер. Почему это плохо ? Чем лучше используемый метод, кодирование синусами и косинусами?