Есть 2 массива с цифрами - один на 4 млн. значений, другой на 3 млн. Нужно найти значения в первом которых нет во втором. При попытке загрузить оба массива в память что бы сделать array_diff ругается на нехватку памяти.
Как поступить? Использовать базу? Приходит на ум искать значения по одному или по несколько. Оптимально ли это? Какой алгоритм будет наилучшим?
Для правильного вопроса надо знать половину ответа
Смотря какой диапазон значений. Если это действительно цифры, то есть диапазон от 0 до 9, то посчитать количество каждых цифр в каждом массиве и сравнить.