Есть ли на python защита от утечки электронных документов?

Question

Кирилл Петров @Recosh

Программист студент

Есть ли на python защита от утечки электронных документов?

Приветствую! Подскажите, вот есть DOC или PDF файл. Задача сгенерировать изображения каждому пользователю и чуть чуть исказить, сместить некоторые символы. Что бы потом, если изображение документа где то всплывёт по этим внесённым изменениям можно было определить, от какого пользователя произошла утечка.

Я вижу такое решение:
Каждому пользователю выдаём уникальный токен. Потом генерируем набор случайных чисел от токена в качестве соли. Берём каждый документ и незначительно смещаем/кропаем/корёжим некоторые символы на полученные цифры. Полученное изображение сохраняем себе и отдаём пользователю.

Если требуется определить, чей документ, то просто сравниваем скользящим окном некоторые части документа, это есть в opencv на сколько помню.

Вроде подводных камней нет и не я это первый сейчас придумал, так может уже есть реализация нечто подобного уже?

UPD: Ссылки на другие программы/ресурсы с такой функцией тоже приветствуются)

Вопрос задан более трёх лет назад
162 просмотра

3 комментария

Подписаться 2 Простой 3 комментария

Viktor T2 @Viktor_T2

Стеганография
https://ru.wikipedia.org/wiki/%D0%A1%D1%82%D0%B5%D...
https://github.com/search?l=Python&q=Steganography...

Написано более трёх лет назад
hint000 @hint000

Это у больших киношников популярно. До выхода фильма в прокат могут выдавать его для предварительного просмотра кинокритикам, журналистам и т.п.
В каждый экземпляр встраиваются уникальные "водяные знаки", не различимые глазом и даже труднообнаружимые универсальными алгоритмами, но легкообнаружимые, если точно знать, что и где искать.

Написано более трёх лет назад
Saboteur @saboteur_kiev Куратор тега Python

Это не защита от утечки, это уже способ определить каким образом утекло. А что с этой информацией делать - скорее всего ничего

Написано более трёх лет назад

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 2

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+3 ещё

Простой
Авто торговля на байбите?
- 1 подписчик
- 15 мая
- 329 просмотров
1

ответ
Python

Простой
Как научиться извлекать математическую модель для решения задач на программирование?
- 1 подписчик
- 14 мая
- 235 просмотров
2

ответа
Python

+3 ещё

Средний
Как перенести позу SMPL модели на игровую 3д модель?
- 2 подписчика
- 10 мая
- 283 просмотра
1

ответ
Active Directory

+3 ещё

Сложный
Шифрование флешек в домене AD. Как и чем?
- 5 подписчиков
- 06 мая
- 752 просмотра
2

ответа
Python

+1 ещё

Простой
Как при вызове хранимой процедуры получать значения RAISE NOTICE?
- 2 подписчика
- 13 апр.
- 280 просмотров
2

ответа
Python

+2 ещё

Простой
Почему не работает Selenium?
- 1 подписчик
- 09 апр.
- 315 просмотров
2

ответа
Python

Простой
В чем ошибка в использовании ft.ResponsiveView в данном коде?
- 1 подписчик
- 08 апр.
- 103 просмотра
1

ответ
Python

Простой
Можно ли указывать во flet heigh и width через проценты?
- 1 подписчик
- 02 апр.
- 118 просмотров
1

ответ
Python

Простой
Как правильно позиционировать элементы во flet?
- 1 подписчик
- 02 апр.
- 108 просмотров
1

ответ
Защита данных

Простой
Чем опасен взлом игр гипервизором?
- 1 подписчик
- 31 мар.
- 831 просмотр
1

ответ
Показать ещё Загружается…

Стеганография
https://ru.wikipedia.org/wiki/%D0%A1%D1%82%D0%B5%D...
https://github.com/search?l=Python&q=Steganography...
Это у больших киношников популярно. До выхода фильма в прокат могут выдавать его для предварительного просмотра кинокритикам, журналистам и т.п.
В каждый экземпляр встраиваются уникальные "водяные знаки", не различимые глазом и даже труднообнаружимые универсальными алгоритмами, но легкообнаружимые, если точно знать, что и где искать.
Это не защита от утечки, это уже способ определить каким образом утекло. А что с этой информацией делать - скорее всего ничего

Answer 1 · 2022-01-18 01:21:58

Идея здравая, и где-то подобное уже проскакивало. Кратко - в документе можно менять отдельные символы на схожие по написанию ("с" кириллица => "с" латиница) (фу так делать, это ухудшит поиск по документу) или играться с пробелами (вставлять второй пробел между словами). Конечно, если пользователь подозревает о таком DRM, то вычистить его из doc'а - пара пустяков; из pdf - сложнее.

Answer 2 · 2022-01-18 04:12:12

Дополню предыдущие ответы. Да, если прогнать через OCR, то ("с" кириллица => "с" латиница) не сработает, и лишние пробелы могут не сработать (а тем более небольшие сдвиги и искажения символов). Зато могут сработать умышленные ошибки в орфографии и пунктуации. Если не переборщить (многочисленные ошибки бросаются в глаза, а единственную ошибку на странице многие не заметят).

Есть ли на python защита от утечки электронных документов?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт