@weart

Лучший способ чекать наличие файлов из одних архивов в других?

Привет всем.
Имеется сайт, где есть куча постов с архивами, внутри которых файлы.
Задача: определять при загрузке нового архива, используется ли что-то из таких вложенных файлов уже где-то на сайте и создавать связи между постами.

Первым шагом я планирую пройтись очередями по всем постам, распарсить файлы и записать данные в виде

id int(11) NOT NULL AUTO_INCREMENT,
parent_file_id int(11) NULL,
post_id int(11) NULL,
user_id int(11) NULL,
file_name TINYTEXT NULL,
mime_type TINYTEXT NULL,
md5 VARCHAR 255


Вторым шагом сделать связи что-то типа

internal_file_id к id 
related_parent_file_id к parent_file_id


Потом при загрузке файла искать по md5 в первой таблице и создавать связи во второй.

Подскажите, норм ли это способ, или есть что-то оптимальнее?
  • Вопрос задан
  • 60 просмотров
Пригласить эксперта
Ответы на вопрос 1
@pantsarny
Помимо хеша файла храни и его размер, так как можно получить коллизии на больших файлах. Сравнивай и размер и хеш
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы