Стандартом Юникод
определено из соображений обратной совместимости несколько символов (сочетаний символов), после которых идет обязательный переход на новую строку
VT: Vertical Tab, U+000B
FF: Form Feed, U+000C
CR: Carriage Return, U+000D
CR+LF: CR (U+000D) followed by LF (U+000A)
LF: Line Feed (U+000A)
NEL: Next Line, U+0085
LS: Line Separator, U+2028
PS: Paragraph Separator, U+2029
(при этом эффект переноса для VT и NEL не обязателен к исполнению при реализации стандарта).
На практике в UTF-8 для переноса строк обычно используются те же символы, что и в ASCII (они и кодируются так же, как в ASCII):
- CR: Carriage Return, UTF-8: 0x0D
- LF: UTF-8: 0x0A
- CR+LF: UTF-8: 0x0D0A