а как при не 100% точности подходит сравнение хэшей?
Думали еще из файлов выдирать контент, закидывать его в elasticsearch и потом для новых файлов по нему делать поиск.В описанных мной вариантах - в первом Вы вообще ничего не выдерете (если не прикрутите безошибочный OCR, которого не существует), во втором Вы получите малоосмысленный набор символов, пригодный только как упражнение на дешифровку многозначного подстановочного шифра (и его тоже проще распознать. чем дешифровать).
с точностью совпадения, допустим в 99%. Поэтому по хэшам не подходит.Вот как раз при высокой, но не 100% точности, сравнение хэшей подходит как нельзя лучше.
мне хотя бы просто осмыслить, как создать эти два последних столбца
Провайдеры их до сих пор используют. В здание заводиться оптика, ставиться кросс, а дальше если клиентов не много медиаконвертор.
WHERE user_id = CURRENT_USER()
только начал учить php и mysqlНу это не повод валить всё в одну кучу. PHP отдельно, MySQL отдельно, а не всё вперемешку.
Вот функция получения данных тестаВот скажите, за каким фигом в результатах теста нужны все варианты ответа, а не только выбранный? да ещё и в случайном порядке...
Файл с подписью - документ, по сравнению с ним файл без подписи - ничто, нуль, пустое место.
Ещё вариант - есть документ, он проходит регистрацию и получает регномер, формируется новый документ с добавленными номером и датой, Вы определяете его как дубликат и опускаете в корзину...