Как исправить отличающийся символ в названии файла на macos и windows?

Question

TemaKam @TemaKam

Как исправить отличающийся символ в названии файла на macos и windows?

Если создать файл на винде, в названии которого будет буква "й", перекинуть его на мак, а затем создать файл на маке с таким же названием и сравнить их названия - они будут отличаться

соответственно в коде на python сравнение также неправильно работает (список файлов через os.listdir()), кодировка при чтении содержимого не влияет на название
что нужно сделать, чтобы привести названия к 1 формату?

в байтах вот так названия

b'\xd0\xb4\xd1\x80\xd1\x83\xd0\xb7\xd0\xb5\xd0\xb9.txt'

- мак

b'\xd0\xb4\xd1\x80\xd1\x83\xd0\xb7\xd0\xb5\xd0\xb8\xcc\x86.txt'

os.path.normpath() не помогает

import os
s1 = b'\xd0\xb4\xd1\x80\xd1\x83\xd0\xb7\xd0\xb5\xd0\xb9.txt'
s2 = b'\xd0\xb4\xd1\x80\xd1\x83\xd0\xb7\xd0\xb5\xd0\xb8\xcc\x86.txt'
print(s1.decode("utf-8"), s2.decode("utf-8"), sep="\n")
print(s1.decode("utf-8") == s2.decode("utf-8"))
print(os.path.normpath(s1.decode("utf-8")) == os.path.normpath(s2.decode("utf-8")))

Вопрос задан более двух лет назад
231 просмотр

6 комментариев

Подписаться 1 Простой 6 комментариев

Алан Гибизов @phaggi Куратор тега Python

Если нет кода python, не ставьте тэг python.

Написано более двух лет назад
TemaKam @TemaKam Автор вопроса

Алан Гибизов, ну нужно знать как привести названия к 1 формату на питоне - в вопросе указал про os.listdir()

Написано более двух лет назад
Алан Гибизов @phaggi Куратор тега Python

TemaKam, как куратор тэга python повторяю: упоминания не достаточно, чтобы ставить тэг языка. Требуется, чтобы проблема была либо в коде на языке, а фрагмент кода приведен а вопросе, либо у вас была конкретная проблема с конкретным нюансом языка.
А у вас проблема с кодировками.

Вот если бы вы привели свою попытку решения проблемы с кодировками на python с учетом разных ОС и у вас там что-то не складывалось…

Написано более двух лет назад
TemaKam @TemaKam Автор вопроса

Алан Гибизов, попытки нет, потому что непонятно что и где указывать надо для этого

Написано более двух лет назад
TemaKam @TemaKam Автор вопроса

Алан Гибизов, добавил еще в конец, теперь можно тег добавить?)

Написано более двух лет назад
TemaKam @TemaKam Автор вопроса

хотя добавлю еще код для воспроизведения

Написано более двух лет назад

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Решения вопроса 1

Комментировать

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Простой
Почему разрывается подключение к бд на сервере?
- 1 подписчик
- 18 июн.
- 211 просмотров
1

ответ
Python

+2 ещё

Средний
Как новичку найти первые заказы на парсинг данных (Python)?
- 1 подписчик
- 17 июн.
- 557 просмотров
2

ответа
Python

+1 ещё

Сложный
Как на Python реализовать алгоритм, чтобы персонаж шёл по определенному маршруту в Genshin Impact?
- 3 подписчика
- 15 июн.
- 495 просмотров
2

ответа
Python

+1 ещё

Средний
Может кто помочь исправить код LTSM нейросети?
- 1 подписчик
- 12 июн.
- 283 просмотра
2

ответа
Python

+1 ещё

Средний
Telethon отказывается соединятся с серверами Telegram, как это обойти?
- 1 подписчик
- 10 июн.
- 510 просмотров
1

ответ
Python

+1 ещё

Простой
Почему копируется атрибут при создании нового экземпляра?
- 1 подписчик
- 08 июн.
- 214 просмотров
2

ответа
C++

+1 ещё

Простой
В Терминал С++ выводятся неизвестные символы?
- 1 подписчик
- 05 июн.
- 185 просмотров
3

ответа
Python

+2 ещё

Простой
Как правильно настроить статические и медиафайлы на хостинге?
- 1 подписчик
- 04 июн.
- 126 просмотров
1

ответ
Python

Простой
Как отправить видео в мессенджер MAX с прогрессом загрузки Python (tqdm)?
- 2 подписчика
- 30 мая
- 330 просмотров
1

ответ
Python

Простой
Стоит ли переходить на IDE?
- 1 подписчик
- 25 мая
- 665 просмотров
5

ответов
Показать ещё Загружается…

Если нет кода python, не ставьте тэг python.
Алан Гибизов, ну нужно знать как привести названия к 1 формату на питоне - в вопросе указал про os.listdir()
TemaKam, как куратор тэга python повторяю: упоминания не достаточно, чтобы ставить тэг языка. Требуется, чтобы проблема была либо в коде на языке, а фрагмент кода приведен а вопросе, либо у вас была конкретная проблема с конкретным нюансом языка.
А у вас проблема с кодировками.

Вот если бы вы привели свою попытку решения проблемы с кодировками на python с учетом разных ОС и у вас там что-то не складывалось…
Алан Гибизов, попытки нет, потому что непонятно что и где указывать надо для этого
Алан Гибизов, добавил еще в конец, теперь можно тег добавить?)
хотя добавлю еще код для воспроизведения

Answer 1 · 2023-07-31 22:09:28

В linux и macos все кодировки по-умолчанию совпадают с UTF-8, а windows с ее cp1251 и cp866 для любителей острых ощущений.
Что касается нормализации, есть 4 вида: NFC, NFD, NFKC и NFKD
В разницу композиции и декомпозиции углубляться не буду, для этого есть документация и W3C, но отмечу что NFKC и NFKD могут приводить к потере данных, поэтому лучше использовать NFC, а остальные использовать если ее недостаточно.

from unicodedata import normalize

def eq_nfc(str1, str2):
    return normalize('NFC', str1) == normalize('NFC', str2)

Answer 2 · 2023-07-31 20:00:00

TemaKam @TemaKam Автор вопроса

chatgpt дал такое решение

unicodedata.normalize('NFKC', s1_decoded)) == unicodedata.normalize('NFKC', s2_decoded)

Ответ написан более двух лет назад

Комментировать

Как исправить отличающийся символ в названии файла на macos и windows?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт