Есть ли на python защита от утечки электронных документов?

Question

Кирилл Петров @Recosh

Программист студент

Есть ли на python защита от утечки электронных документов?

Приветствую! Подскажите, вот есть DOC или PDF файл. Задача сгенерировать изображения каждому пользователю и чуть чуть исказить, сместить некоторые символы. Что бы потом, если изображение документа где то всплывёт по этим внесённым изменениям можно было определить, от какого пользователя произошла утечка.

Я вижу такое решение:
Каждому пользователю выдаём уникальный токен. Потом генерируем набор случайных чисел от токена в качестве соли. Берём каждый документ и незначительно смещаем/кропаем/корёжим некоторые символы на полученные цифры. Полученное изображение сохраняем себе и отдаём пользователю.

Если требуется определить, чей документ, то просто сравниваем скользящим окном некоторые части документа, это есть в opencv на сколько помню.

Вроде подводных камней нет и не я это первый сейчас придумал, так может уже есть реализация нечто подобного уже?

UPD: Ссылки на другие программы/ресурсы с такой функцией тоже приветствуются)

Вопрос задан более двух лет назад
152 просмотра

3 комментария

Подписаться 2 Простой 3 комментария

Viktor T2 @Viktor_T2

Стеганография
https://ru.wikipedia.org/wiki/%D0%A1%D1%82%D0%B5%D...
https://github.com/search?l=Python&q=Steganography...

Написано более двух лет назад
hint000 @hint000

Это у больших киношников популярно. До выхода фильма в прокат могут выдавать его для предварительного просмотра кинокритикам, журналистам и т.п.
В каждый экземпляр встраиваются уникальные "водяные знаки", не различимые глазом и даже труднообнаружимые универсальными алгоритмами, но легкообнаружимые, если точно знать, что и где искать.

Написано более двух лет назад
Saboteur @saboteur_kiev Куратор тега Python

Это не защита от утечки, это уже способ определить каким образом утекло. А что с этой информацией делать - скорее всего ничего

Написано более двух лет назад

Пригласить эксперта

Ответы на вопрос 2

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Python

+2 ещё

Простой
Как установить 2 версии libssl в kubuntu 22.04?
- 2 подписчика
- 3 часа назад
- 24 просмотра
0

ответов
Python

Простой
Как в библиотеке Flet при нажатии на кнопку сделать, чтобы появилось всплывающее окно?
- 1 подписчик
- 3 часа назад
- 11 просмотров
0

ответов
Python

+1 ещё

Сложный
Интерпретация результатов модели lambdamart?
- 1 подписчик
- 5 часов назад
- 17 просмотров
0

ответов
Python

Простой
Как в конце каждой строки файла добавить тэг?
- 1 подписчик
- вчера
- 112 просмотров
1

ответ
Python

+1 ещё

Простой
Почему asyncio.current_task() не передается в функцию?
- 1 подписчик
- вчера
- 82 просмотра
1

ответ
Информационная безопасность

+1 ещё

Средний
Как рассчитать количество информации в двоично-симметричном канале?
- 1 подписчик
- вчера
- 38 просмотров
0

ответов
Python

+2 ещё

Простой
Срабатывает антивирус на скомпилированный файл python, как исправить?
- 1 подписчик
- вчера
- 191 просмотр
1

ответ
Python

Простой
Почему не срабатывает if? как это пофиксить?
- 1 подписчик
- 22 апр.
- 144 просмотра
2

ответа
Python

+2 ещё

Простой
Как транслировать аудио в микрофон, py, c#, c++?
- 1 подписчик
- 22 апр.
- 168 просмотров
3

ответа
Python

Средний
Почему Низкий FPS анализ изображения yolov8 YOLO?
- 2 подписчика
- 22 апр.
- 33 просмотра
0

ответов
Показать ещё Загружается…

Team Lead (С++, Python)

TopAssistant • Москва

от 400 000 ₽

Python developer

Bell Integrator

До 350 000 ₽

Python developer

Greenway Global • Новосибирск

от 150 000 ₽

Интеграция и обучение по API Яндекс Маркета

24 апр. 2024, в 17:52

20000 руб./за проект

Сайт с вебзвонками и чатами на react

24 апр. 2024, в 17:33

10000 руб./за проект

Правки в webApp готового и написанного телеграмм бота next, tailwind

24 апр. 2024, в 17:26

6000 руб./за проект

Стеганография
https://ru.wikipedia.org/wiki/%D0%A1%D1%82%D0%B5%D...
https://github.com/search?l=Python&q=Steganography...
Это у больших киношников популярно. До выхода фильма в прокат могут выдавать его для предварительного просмотра кинокритикам, журналистам и т.п.
В каждый экземпляр встраиваются уникальные "водяные знаки", не различимые глазом и даже труднообнаружимые универсальными алгоритмами, но легкообнаружимые, если точно знать, что и где искать.
Это не защита от утечки, это уже способ определить каким образом утекло. А что с этой информацией делать - скорее всего ничего

Answer 1 · 2022-01-18 01:21:58

Идея здравая, и где-то подобное уже проскакивало. Кратко - в документе можно менять отдельные символы на схожие по написанию ("с" кириллица => "с" латиница) (фу так делать, это ухудшит поиск по документу) или играться с пробелами (вставлять второй пробел между словами). Конечно, если пользователь подозревает о таком DRM, то вычистить его из doc'а - пара пустяков; из pdf - сложнее.

Answer 2 · 2022-01-18 04:12:12

Дополню предыдущие ответы. Да, если прогнать через OCR, то ("с" кириллица => "с" латиница) не сработает, и лишние пробелы могут не сработать (а тем более небольшие сдвиги и искажения символов). Зато могут сработать умышленные ошибки в орфографии и пунктуации. Если не переборщить (многочисленные ошибки бросаются в глаза, а единственную ошибку на странице многие не заметят).

Есть ли на python защита от утечки электронных документов?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт