Как средствами php сравнить два больших массива?

Question

life_fox @life_fox

PHP

Как средствами php сравнить два больших массива?

Здравствуйте, добрые люди.

Задача: имеется
- папка с картинками (примерно 500 мб)
- база данных(таблица) в которой указаны название картинок (MySQL - 100 тыс. строк)

Надо сравнить название картинок из папки с базой данных и выявить лишние названия картинок

Буду очень благодарен.
Заранее спасибо.

Вопрос задан более трёх лет назад
5026 просмотров

2 комментария

Подписаться 3 Оценить 2 комментария

Помогут разобраться в теме Все курсы

Нетология

Веб-разработчик с нуля: профессия с выбором специализации

14 месяцев

Далее
Stepik

PHP (pro)

2 недели

Далее
Хекслет

PHP-разработчик

10 месяцев

Далее

Решения вопроса 1

Комментировать

Пригласить эксперта

Ответы на вопрос 6

Комментировать

1 комментарий

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

PHP

Средний
Как исправить ошибки шаблона WP?
- 1 подписчик
- 14 июл.
- 111 просмотров
1

ответ
PHP

Средний
Как сделать что бы переменная avatar($ank['id']); не конфликтовала с другим файлом?
- 2 подписчика
- 17 июн.
- 214 просмотров
2

ответа
PHP

+2 ещё

Средний
Как решить проблему с smtp сервером?
- 1 подписчик
- 03 июн.
- 469 просмотров
1

ответ
PHP

Средний
Как составить регулярное выражение?
- 1 подписчик
- 31 мая
- 252 просмотра
2

ответа
PHP

+2 ещё

Простой
Как настроить php_curl для php8 под windows?
- 1 подписчик
- 28 мая
- 197 просмотров
3

ответа
PHP

Простой
При правильном вводе каптчи не прегистрируется как исправить?
- 1 подписчик
- 24 мая
- 158 просмотров
2

ответа
JavaScript

+2 ещё

Средний
Стоит ли переносить логику работающего онлайн-калькулятора с JS на PHP ради защиты формул от копирования?
- 3 подписчика
- 18 мая
- 2474 просмотра
8

ответов
PHP

+1 ещё

Простой
Как получить список файлов из локальной папки?
- 1 подписчик
- 11 мая
- 346 просмотров
6

ответов
PHP

+1 ещё

Простой
Как работать с Manticore Search на php?
- 1 подписчик
- 29 апр.
- 189 просмотров
1

ответ
PHP

Простой
PDO не видит внутри функции?
- 1 подписчик
- 25 апр.
- 252 просмотра
2

ответа
Показать ещё Загружается…

Простите , что не указал. Лишние в папках

Answer 1 · 2013-12-15 12:56:38

Воу-воу, палехчи. Это всё очень круто. Но имеет избыточную сложность, особенно в плане расхода памяти. Как бы сделал я:
1. Сделал бы список файлов в папках (find /path/to/folder -name "*.jpg" >filelist.txt)
2. Грузим в php скрипте файлик file("filelist.txt") - он при этом грузится как массив. Алсо, чтобы экономить память, можно читать через fgets - немного сложнее, но зато веселее.
3. Пробегаем по этому массиву и ищем в БД. Поле с именем файла должно быть индексировано конечно.
Все файлы, что не найдены, удаляем.

Альтернативный вариант - загрузить из БД все записи в виде хеш-таблицы (то есть имена из БД должны стать индексами массива, а значениями - да что угодно). Дальше поиск производить как isset($hash[$name]).

Answer 2 · 2013-12-15 10:07:35

1. Формируем массив array1 - имена файлов в папке - ф-я scandir

2. Формируем массив array2 - названия в БД, выборка наподобие
SELECT image_name FROM my_db
выбираем только имена image_name, то есть названия.

Форматы названий должны совпадать, то есть одинаковые картинки и в БД, и в папке должны иметь абсолютно одинаковые имена, с учетом того, что файлы в папке имеют еще и расширения. Если что - приводим строковыми ф-ями к одинаковому формату (отрезаем расширение файла например)

3. Ф-я array_diff(array1, array2) даст те элементы, которые есть в массиве array1, но нет в массиве array2.

Answer 3 · 2013-12-15 09:58:18

1. Получить список файлов из папки.
2. Получить список файлов из базы.
3. Отсортировать оба списка по алфавиту (можно прямо на шагах 1 и 2, но надо чтобы порядок сортировки был одинаковым).
4. Построчно сравнивать списки, отмечая те строки, которые есть только в одном списке.

Answer 4 · 2013-12-15 09:58:23

В базу добавляем поле-ключ "найдено/не найдено", делаем поле с названием файла тоже ключевым. Далее создаём список файлов и начинаем поиск по базе среди "не найденых" изображения. Найденные изображения помечаем.

Answer 5 · 2013-12-15 09:58:44

Не понял, Вам решить эту задачу надо? Или, подсказать решение?
Если решить, то, я думаю - Вам лучше на фрилансим сходить - Вам там за пару единиц с двумя нулями - Вам эту задачу решат.

Если просто подсказать:
Ну тут, особо ничего сложного.
Самое просто решение:
Бегите по строкам в таблице в БД. Проверяйте есть такой файл или нет. Если нет, сохраняйте решение куда-либо.

Answer 6 · 2013-12-15 10:11:34

Я обращу внимание на то, что предлагавшиеся выше решения в духе "бегите по строкам" и "построчно сранивайте" в данном случае имеют сложность до О(n*n), то есть придется сделать 100000*100000 = примерно 10 миллардов операций.
боюсь, это может затянуться на несколько часов.

Answer 7 · 2013-12-15 11:17:36

Вам стоит обратить внимание на стандартную библиотеку примитивов SPL.
FixedArray и RecursiveDirectoryIterator помогут значительно ускорить обработку.
Также через pcntl_fork или pthread'ы можно распределить задачу по нескольким потокам или процессам.

Как средствами php сравнить два больших массива?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт