У меня есть Массив на 500 записей, и файл в нём таких записей 1 000 000.
Мне не нужно вставлять в файл дубликаты.
Я могу прочитать все записи из файла в HashSet и если в массиве есть те которые уже есть в Set, удалить их из массива и оставшиеся вставить в файл.
Либо могу проверять каждый элемент массива напрямую в файле, и удалять дубликаты.